JP2004242250A - Image playback device - Google Patents
Image playback device Download PDFInfo
- Publication number
- JP2004242250A JP2004242250A JP2003032267A JP2003032267A JP2004242250A JP 2004242250 A JP2004242250 A JP 2004242250A JP 2003032267 A JP2003032267 A JP 2003032267A JP 2003032267 A JP2003032267 A JP 2003032267A JP 2004242250 A JP2004242250 A JP 2004242250A
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- frequency band
- reproduction
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は画像再生技術に関し、特には画像を高速に再生可能な画像再生技術に関する。
【0002】
【従来の技術】
従来、例えば動画データのように時間的に連続した画像データを再生する際、所望の内容を短時間で探したり、全体の流れを大まかに把握する等の目的で、実記録時間よりも高速な再生を行うことに対する要求がある。
【0003】
そして、このような高速再生機能を有する画像再生装置も実現されている。一般に、動画はフレームと呼ばれる1画面分の画像の集合であるため、記録されているフレームを数フレームおきに再生するなど、間引き再生することにより高速再生機能を実現することが可能である。
【0004】
しかしながら、このような間引き再生を行った場合、再生速度を上げるに従って(すなわち、間引くフレームを多くするにつれて)、再生される動画はぎくしゃくしたものになり、視覚特性が良好とは言えない。
【0005】
視覚特性を改良した高速再生方法として、例えば、特許文献1には、1つのイントラ符号化フレームと複数のインター符号化フレームとが交互に現れる符号化画像データのうち、イントラ符号化フレームのみを再生する高速再生方法が開示されている。また、特許文献1には、イントラ符号化フレームを水平方向に分割したスライスと呼ばれる部分画像に分解し、1スライス/フレームの再生を行うことで、さらに高速な再生を行うことが記載されている(図1〜図3)。
【0006】
また、特許文献2には、MPEG形式で符号化された動画像を高速再生する際、連続する複数のフレームの部分画像から1フレームの合成画像を生成し、この合成画像を再生する方法が提案されている(図6)。
【0007】
【特許文献1】
特開平7−162851号公報
【特許文献2】
特開2001−352524号公報
【0008】
【発明が解決しようとする課題】
これら特許文献で提案されているような高速再生方法は、単純なフレーム間引きに比べ、高速再生時にも画像の動きを視覚的に滑らかに表示させる事ができる。しかしこれらの提案ではいずれも複数のフレーム画像を矩形状にスライス(分割)し、各画像のスライス画像を組み合わせて1フレーム分の合成画像を構成しているため、合成画像には異なる時間に撮影された画像が混在することになる。
【0009】
そのため、図12のようにフレーム間で動きのある4フレームの画像から合成画像を生成すると、図13に示すようなずれを有する合成画像となり、再生される画像は視覚的に好ましくなくなってしまう。
【0010】
また、このような合成画像を生成しながら高速再生するためには、通常の1フレーム分の再生処理時間内に複数の画像を読み出して合成し、再生する必要があるため、装置の処理負荷が増大したり、メモリ等の資源を大量に必要とする場合があった。例えば特許文献2の提案する方法では、2倍速再生時には2倍の速さでデータを読み出す必要がある。
【0011】
本発明はこのような従来技術の問題点に鑑みなされたものであり、その目的は、簡便な処理で、動きの大きさに係わらず、高速再生時にも滑らかな表示が可能な画像再生装置を提供することである。
【0012】
【課題を解決するための手段】
上述の目的を達成するため、本発明による画像再生装置は、複数の周波数帯域成分に分割して記録された画像データを帯域合成して出力する画像再生装置であって、画像データを取得するデータ取得手段と、取得した画像データを帯域合成して出力する再生出力手段と、再生条件に応じてデータ取得手段及び再生出力手段を制御する制御手段を有し、制御手段は、連続するm(mは2以上の整数)枚の画像を構成する画像データから1枚の画像を帯域合成して再生出力する場合、データ取得手段によって、(mー1)枚の画像を構成する画像データの各々からは、複数の周波数帯域成分のうち一部の周波数帯域成分のデータを、残りの1枚の画像を構成する画像データからは、複数の周波数帯域成分の少なくとも一部の周波数帯域成分のデータをそれぞれ取得させ、再生出力手段が、当取得したデータに基づいて、1枚の画像を帯域合成し、出力するように制御することを特徴とする。
【0013】
【発明の実施の形態】
以下、添付図面を参照して、本発明をその好適な実施形態に基づき詳細に説明する。
■(第1の実施形態)
図1は、本発明の画像再生装置の一例としての記録再生装置における、記録系100の構成例を示すブロック図であり、図4は同装置の再生系400の構成例を示すブロック図である。
【0014】
■(記録系100の構成)
まず、図1を参照して記録系100の構成及び動作について説明する。図において、101はレンズや絞り等で構成されるレンズ部、102はCCD、CMOSセンサ等の撮像素子で構成される撮像部である。103は撮像部102から出力されるデータを一時記憶するメモリ部である。104はメモリ部103に一時記憶された画像データに所定の処理を行う画像データ作成部である。105はレンズ部101〜画像データ作成部104を統合的に制御するカメラ制御部である。
【0015】
■(記録系100の動作)
レンズ部101を通じて入射する光は、撮像部102の撮像素子上に結像される。そして、撮像部102ではカメラ制御部105からの駆動制御信号により、撮像素子が駆動される。撮像素子の出力信号は撮像部102内でA/D変換された後、メモリ部103に記憶される。記憶された画像データはカメラ制御部105からのメモリ読み出し制御信号によって画像データ作成部104に入力される。
【0016】
画像データ作成部104では、画素補間処理、色演算処理、ガンマ処理等の処理を行い、1画面分のベースバンド画像データを作成する。画像データ作成部104で作成された画像データは後述する画像圧縮部120に入力される。
【0017】
本実施形態では、画像圧縮部120が行う画像圧縮符号化処理として、画像データを複数の帯域に分割し、圧縮伸長を行う所謂JPEG2000方式に準拠した圧縮符号化処理を行うものとして説明する。なお、JPEG2000方式の圧縮符号化方式に関しては、ISO/IEC15444において詳細に説明されているので、ここでは本実施形態の理解に必要な部分についてのみ説明する。
【0018】
画像データ作成部104で作成された画像データは、画像圧縮部120の離散ウェーブレット変換部106に入力され、2次元の離散ウェーブレット変換が施される。
【0019】
図2(a)は入力信号を帯域分割する離散ウェーブレット変換部106の構成例を示す図である。同図においてH0およびH1はFIRフィルタであり、H0はローパス、H1はハイパス特性を持っている。また、下向き矢印記号を有する円形部分は、ダウンサンプラを表している。入力される多値画像信号はフィルタH0およびH1で処理されて異なる周波数帯域の信号に分割された後、2:1にダウンサンプリングされる。この構成は2チャンネルのフィルタバンクと等価であり既に周知であるため、ここでは詳細な説明は省略する。
【0020】
図2(a)において入力されたベースバンドの多値画像信号について水平方向および垂直方向の変換処理を1つの組として処理を行っている。さらに、最初の1組の処理終了後、さらに最も周波数帯域の低い信号(LL1)に対して同じ処理を繰り返し行うことにより最終的には7つの異なる周波数帯域に属する一連のデータが出力される。
【0021】
図2(b)は、図2(a)に示す構成からなる離散ウェーブレット変換部106において変換処理を行った結果、入力された多値画像信号が異なる周波数帯域(サブバンド)に分割された様子を表したものであり、各周波数帯域に対してHH1,HL1,LH1,…,LL2のようにラベル付けを行った例を示す。以降の説明においては、水平方向および垂直方向への1組の変換処理を分解の1レベルと考え、各周波数帯域HH1,HL1,LH1,…,LL2をサブバンド変換係数と称する。
【0022】
これら離散ウェーブレット変換部106から出力されたサブバンド変換係数は図1の量子化部107に出力される。量子化部107は離散ウェーブレット変換部106から出力されたサブバンド変換係数を量子化するものである。図3は、量子化部107における入力値と出力値の関係を示す図である。このように、量子化部107はサブバンド変換係数を線形量子化し、量子化インデックスに変換して後続のエントロピ符号化部108に出力する。
【0023】
エントロピ符号化部108は入力された量子化インデックスをビットプレーンに分解し、ピットプレーンを単位としてエントロピ符号化を行ってコードストリームとして出力する。コードストリームは画像符号化データ出力部109によりヘッダ情報等が付加され所定のファイル形式に加工された後、記録装置110に出力される。記録装置110はメモリーカードや光ディスク、磁気ディスク等で構成される。また記録装置110としてネットワークを介して接続されたコンピュータやサーバーを用いても良い。
【0024】
■(再生系400の構成)
次に、本実施形態に係る記録再生装置の再生系400について説明する。図4は図1に示した記録系100で符号化された画像データの伸張、再生を行う再生系400の構成例を示すブロック図である。
【0025】
図4において、110は図1に示した記録装置、401は符号読み出し部、402はエントロピ復号化部、403は逆量子化部、404は復号用バッファメモリ部、405は逆離散ウェーブレット変換部であり、402〜405が圧縮された画像データを伸長する画像伸長部410を構成する。406は表示用バッファメモリ部、407はLCD、CRT等の画像出力部、408は再生系400を総合的に制御する再生制御部である。再生制御部408には各種再生動作をユーザが指定するための操作スイッチ409が接続されている。
【0026】
■(通常再生時の動作)
まず、通常再生(等速再生)時の動作について説明する。上述した記録系100によって圧縮符号化され、記録装置110に記録された画像データは、符号読み出し部401によって読み出される。符号読み出し部401はデータストリームに含まれるヘッダを解析し、後続の復号化処理に必要なパラメータを抽出する。
【0027】
その後、エントロピ復号化部402はエントロピ符号化部108と逆の復号化処理を行い、量子化された係数値を復号する。復号された係数値は後続の逆量子化部403に出力される。逆量子化部403は、入力された係数値を量子化部107と同じ量子化特性を用いて逆量子化し、結果として得られる離散ウェーブレット変換係数を復号用バッファメモリ部404に格納する。
【0028】
次に、逆離散ウェーブレット変換部405の詳細構成例を示す図5を参照して、逆離散ウェーブレット変換部405において、復号用メモリ404に格納された変換係数を逆離散ウェーブレット変換する手順について説明する。
【0029】
逆離散ウェーブレット変換部405は、図2で説明した離散ウェーブレット変換部106と対称的な構成を有し、1:2のアップサンプラとフィルタG0及びG1とから構成され、逆変換処理を行う。すなわち、アップサンプラはダウンサンプラの、フィルタG0はフィルタH0の、フィルタG1はフィルタH1のそれぞれ逆の処理を行う。
【0030】
逆離散ウェーブレット変換部405はまず、復号用バッファメモリ部404に格納されたLL2およびLH2のサブバンド変換係数を垂直方向に読み出して1:2にアップサンプリングした後、LL2に対してはG0、LH2に対してはG1によるフィルタ処理を施して加算する。また同様の処理をHL2,HH2に対しても行う。次に、以上の処理結果を水平方向に読み出し、先程LL2およびLH2から得られた結果に対してはアップサンプリング後G0を、HL2およびHH2から得られた結果に対してはアップサンプリング後G1を施して加算する。以上の処理により、1レベルの合成が終了する。
【0031】
以上の処理を全てのレベルで行うことによりベースバンドの画像データを復号する事ができる。逆離散ウェーブレット変換部405で複合されたベースバンド画像データは表示用バッファメモリ部406に入力される。画像出力部407は表示用バッファメモリ部406からのデータを可視画像としてLCDやCRTモニタ等の表示装置に出力する。
【0032】
このように、再生制御部408は通常再生時には、図6(a)に示すような各フレームの全てのサブバンド変換係数を復号し、図6(b)に示すように時間順に復号し表示させる制御を行う。図6においてn、n+1、・・・とは連続したフレーム画像の順序を示すものであり、この例では第nフレームの画像から1/30秒の間隔をおいて第(n+1)フレームの画像が表示される。
【0033】
■(高速再生時の動作)
次に、図4の再生系400を用いて高速再生(サーチ)を行う際の動作について説明する。
例えば、操作スイッチ409から高速再生(ここでは2倍速再生とする)の指示があると、再生制御部408は符号読み出し部401に対し、2倍速再生を行うことを通知する。符号読み出し部401は、通知された再生速度と予め定められた高速再生時のフレーム読み出し方法との対応に従い、記録装置110から各フレームについてのサブバンド変換係数を読み出す。
【0034】
すなわち、通常再生時には、各フレームについて全サブバンドの変換係数を読み出し、復調再生したが、高速再生時には、全サブバンドについてサブバンド変換係数を読み出すフレームと、一部のサブバンドのサブバンド変換係数のみを読み出すフレームが存在する。本実施形態においては、m倍速の再生(mは2以上の整数)が指示されると、mフレーム毎に1フレームのみ全サブバンドのサブバンド変換係数を読み出し、残りの(m−1)フレームについては最下位レベルのLLサブバンド(本実施形態では2レベルの離散ウェーブレット変換を行っているため、LL2サブバンド)のサブバンド変換係数のみを読み出す。
【0035】
今は2倍速再生であるから、図7(a)に示すように、LL2サブバンド変換係数のみを読み出すフレーム(n,n+2,n+4)と、全サブバンド変換係数を読み出すフレーム(n+1,n+3,n+5)とが交互に存在する。LL2サブバンド変換係数のみを読み出すのに必要な時間は全サブバンドの変換係数を読み出す場合に比べて十分短いため、特許文献2に記載されるような、m倍速再生では通常再生時のm倍の速さで読み込むと言ったような高速読み出しは不要であり、符号読み出し部401は高速再生時であっても、通常再生時より少し早い速度で読み出しを行えばよい。
【0036】
LL2サブバンド変換係数のみを読み出すには、記録されている画像データのヘッダを解析して図7(a)のLL2サブバンド以外のサブバンド(斜線部)のサブバンド変換係数データについては記録装置110から読み出さない処理を行う。
【0037】
読み出された各サブバンド変換係数のデータはエントロピ復号化部402により量子化された係数値を復号する。復号された係数値は後続の逆量子化部403に出力される。逆量子化部403は、入力された係数値を逆量子化し、得られる離散ウェーブレット変換係数を復号用バッファメモリ部404に格納する。
【0038】
その後、再生制御部408は復号用バッファメモリ部404内で、連続するmフレームを合成し、1つの合成フレームを生成する。すなわち、LL2サブバンドの変換係数のみを読み出した(m−1)フレームと、全サブバンドの変換係数を読み出した1フレームを合成し、1つの合成フレームを生成する。
【0039】
本実施形態において合成フレームは、全サブバンドの変換係数を読み出したフレームのLL2サブバンド変換係数と、残りの(m−1)フレームのLL2サブバンド変換係数を加重平均することによって生成される。
【0040】
すなわち、図7(b)に示すように、第(n+1)フレームのLL2成分LL2(n+1)と第nフレームのLL2成分LL2(n)に、それぞれ所定の重み係数α、βを乗算して加算させ、合成後のLLサブバンド変換係数であるLL(n+1)’を演算する。すなわち、
LL(n+1)’=α×LL(n+1)+β×LL(n)
という加重平均演算を行う。
【0041】
本実施形態において、係数α、βはα+β=1.0なる関係を満たすものとする。従って、例えば単純な平均値を取ることで合成を行う場合にはα=0.5、β=0.5となり、第(n+1)フレームのLL成分を強調させたい場合には例えばα=0.7、β=0.3のようにα>βとなるように係数値を定めて加重平均演算を行う。このようにLLサブバンド変換係数が加重平均された1フレーム分の各サブバンド変換係数値は逆離散ウェーブレット変換部405によりベースバンドの画像データに変換される。その後、画像データは表示用バッファメモリ部406に入力され画像出力部407に可視画像として図7(c)のごとく出力される。
【0042】
このように、再生系400は、再生制御部408の制御に従って、2倍速再生においては図7(a)に示すように、特定のサブバンドの変換係数(本実施形態ではLLサブバンド)のみを読み出すフレームと、全サブバンドの変換係数を読み出すフレームとを交互に設け、図7(b)に示すように連続する2フレームのサブバンド変換係数をサブバンド単位で加重平均して1つの合成フレームを生成する。そして、この合成フレームをベースバンドの画像信号に復号し表示させる。連続する2フレームに対するこれらサブバンド係数の読み出し、合成及び復号処理を1フレーム区間(1/30)で行うことにより、図7(c)に示すように2倍速再生が実現できる。
【0043】
図7(c)に示すように、本実施形態における高速再生で表示される画像は、単純なフレーム間引き方法では完全に情報が欠落してしまう第nフレームや第(n+2)フレームの画像成分がそれぞれ第(n+1)フレーム、第(n+3)フレームの再生画像に残像のように表示されるので、2倍速再生を表示させた場合にも自然な表示効果を得る事ができる。
【0044】
また上述したように、本実施形態では記録装置に記録されているサブバンド変換係数を読み出す場合に、m倍速再生時には記録された連続画像のうちmフレームに1枚は全てのサブバンドのサブバンド変換係数を読み出し、その他の間引かれた(m−1)フレームについては一部のサブバンド変換係数(本実施形態ではLL2サブバンド変換係数)のみを読み出せば良いので、m倍の速さでmフレームの全てについて全変換係数を読み出す必要がなく、使用するメモリ容量や消費電力を低減させる効果も有する。
【0045】
このような高速再生方法は、2倍速再生に限らず、m倍速(mは2以上の整数)再生に適用可能であることは明らかである。
例えば、3倍速再生を行う場合には、図8に示すように処理を行えばよい。図7に示した2倍速再生時の処理と比較するとわかるように、3倍速再生時には、連続する3フレーム中2フレームがLL2サブバンド変換係数のみを読み出すフレームになり、3フレーム分のLL2サブバンド変換係数が加重平均される点を除いて共通の処理が行われる。
【0046】
復号用バッファメモリ部404内での加重平均動作は、図8(b)に示すように第(n+2)フレームのLL2成分LL2(n+2)と第(n+1)フレームのLL2成分LL2(n+1)と第nフレームのLL2成分LL2(n)とをそれぞれ所定の係数α、係数β、係数γを乗算して加算する処理となる。すなわち、合成後のLL2サブバンド係数LL2(n+2)’は、
LL2(n+2)’=α×LL2(n+2)+β×LL2(n+1)+γ×LL2(n)
で求められる。
【0047】
この場合、α+β+γ=1.0なる関係にある。例えば単純な平均値を演算する場合はα=0.33、β=0.33、γ=0.33となり、第(n+2)フレームのLL成分を強調させたい場合には例えばα=0.5、β=0.3、γ=0.2として加重平均の演算を行わせる。このように加重平均された各サブバンド変換係数値は逆離散ウェーブレット変換部405によりベースバンドの画像データに変換される。その後、画像データは表示用バッファメモリ部406に入力され画像出力部407に可視画像として図8(c)のごとく出力される。
【0048】
連続する3フレームに対するこれらサブバンド係数の読み出し、合成及び復号処理を1フレーム区間(1/30)で行うことにより、3倍速再生が実現できる。
【0049】
図8(c)に示す表示画像においても従来の単純なフレーム間引き方法では完全に情報が欠落してしまっていた第nフレームや第(n+1)フレームの画像成分が第(n+2)フレームの復号画像に残像のように表示され、3倍速再生を表示させた場合にも自然な感じで再生表示をさせる事が可能となる。
【0050】
以降m倍速再生の場合も同様にして、加重平均の係数をm個用いてmフレーム分のLL成分の加重平均演算を行い、得られたサブバンド係数を逆離散ウェーブレット変換部405によりベースバンドの画像データに変換する事によって残像効果が得られ、フレーム間の動きが大きくても視覚的な違和感の少ないm倍速再生を行う事ができる。
【0051】
■(第1の実施形態の変形例)
上述の例では、一部のサブバンド変換係数のみを読み出すフレーム(間引きフレーム)に対しては、LL2サブバンド変換係数のみを読み出し、LL2サブバンド変換係数を加重平均した合成フレームを生成していた。
しかし、間引きフレームについて読み出すサブバンド変換係数の種類及び数は、それが全てのサブバンド係数とならない範囲で任意に設定することが可能である。
【0052】
すなわち、図9(a)、(b)に示すように、LL2サブバンド変換係数の他に、HL2,LH2、HH2のサブバンド変換係数についても読み出しを行い、これらのサブバンド変換係数を加重平均して合成フレームを生成、再生するようにしてもよい。
この場合、加重平均演算はサブバンド単位で行う。また、図9は2倍速再生時について示しているが、3倍速以上の高速再生においても同様に処理すればよい。
【0053】
以上説明したように、本実施形態によれば、複数の周波数帯域成分毎に圧縮符号化された画像を高速再生する際に、再生する1フレーム分の画像を表すサブバンド変換係数の一部を、複数の連続するフレームのサブバンド変換係数から生成することにより、簡便な処理で、かつフレーム間の動きによらず、視覚的に違和感の少ないなめらかな高速再生が可能になる。
【0054】
■(第2の実施形態)
第1の実施形態においては、合成対象となる各フレームで共通したサブバンド変換係数を加重平均して合成フレームを生成していた。これに対し本実施形態は、合成対象となる各フレームから互いに異なるサブバンド変換係数を読み出し、1つの合成フレームを生成することを特徴とする。
【0055】
なお、本実施形態で説明する高速再生方法も、第1の実施形態で説明した記録再生装置で実施することが可能であるため、記録再生装置の構成に関する説明は省略する。また、当倍速の再生時の処理についても第1の実施形態と共通であるため、以下高速再生時の動作についてのみ説明する。
【0056】
第1の実施形態と同様、まず2倍速再生について説明する。例えば、図4における操作スイッチ409から2倍速再生の指示があると、再生制御部408は符号読み出し部に対し、2倍速再生を行うことを通知する。符号読み出し部401は、通知された再生速度と予め定められた高速再生時のフレーム読み出し方法との対応に従い、記録装置110から各フレームについてのサブバンド変換係数を読み出す。
【0057】
すなわち、通常再生時には、各フレームについて全サブバンドの変換係数を読み出し、復調再生したが、高速再生時には、合成対象となるフレームで互いに異なるサブバンドについてサブバンド変換係数を読み出す。本実施形態においては、m倍速の再生(mは2以上の整数)が指示されると、連続するmフレームから互いに異なるサブバンドのサブバンド変換係数であって、かつこれらmフレームから読み出したサブバンド変換係数によって全種類のサブバンドについてのサブバンド変換係数が得られるように読み出しを行う。
【0058】
従って、2倍速再生時には、例えば図10(a)、(b)に示すように、連続する2フレームの符号化画像データの一方のフレームからは第2レベル(LL2、HL2、HH2、LH2)のサブバンド変換係数を、他方のフレームからは第1レベル(HL1、HH1、LH1)のサブバンド変換係数を読み出すことにより、連続する2フレーム分の画像データから、1つのフレームを合成するために必要な全サブバンドのサブバンド変換係数を得る。
【0059】
すなわち、第nフレームと第(n+1)フレームについて言えば、第nフレームの画像データについてはHL1(n)、HH1(n)、LH1(n)のサブバンド変換係数データを読み出し、続く第(n+1)フレームの画像データについてはLL2(n+1)、HL2(n+1)、HH2(n+1)、LH2(n+1)のサブバンド変換係数データを読み出す。
【0060】
このように、ある連続した2フレームの画像データから、図10(b)に示すように1画面分の全てのサブバンド変換係数が組み合わされるよう、互いに異なるサブバンド変換係数のデータを読み出す。
【0061】
読み出された各サブバンド変換係数のデータはエントロピ復号化部402により量子化された係数値を復号する。復号された係数値は後続の逆量子化部403に出力される。逆量子化部403は、入力された係数値を逆量子化し、得られる離散ウェーブレット変換係数を復号用バッファメモリ部404に格納する。
【0062】
その後、図10(b)に示すように組み合わされた1画面分のサブバンド変換係数値は逆離散ウェーブレット変換部405によりベースバンドの画像データに変換される。そして、ベースバンド画像データは表示用バッファメモリ部406に入力され、画像出力部407に可視画像として図10(c)に示すように出力される。
【0063】
このように、再生系400は、再生制御部408の制御に従い、2倍速再生においては図10(a)に示す各フレームの連続する2フレームから、図10(b)に示すように全サブバンドのサブバンド変換係数が得られ、かつ各フレームからは異なるサブバンドのサブバンド変換係数を読み出す。そして、図10(b)に示す合成フレームを作成し、ベースバンドの画像信号に復号し表示させる。連続する2フレームに対するこれらサブバンド係数の読み出し、合成及び復号処理を1フレーム区間(1/30)で行うことにより、図10(c)に示すように2倍速再生が実現できる。
【0064】
図10(c)に示すように、本実施形態における高速再生で表示される画像は、単純なフレーム間引き方法では完全に情報が欠落してしまう第nフレームや第(n+2)フレームの画像成分がそれぞれ第(n+1)フレーム、第(n+3)フレームの再生画像に残像のように表示されるので、2倍速再生を表示させた場合にも自然な表示効果を得る事ができる。
【0065】
また本実施形態ではm倍速再生時、記録装置に記録されているサブバンド変換係数を読み出す際に、データのヘッダを解析し、連続したmフレームの画像データの中からフレーム毎に互いに異なるサブバンド変換係数であって、かつmフレームから読み出した互いに異なるサブバンド変換係数を組み合わせて1フレーム分の全サブバンドのサブバンド変換係数が構成されるように読み出す。従って、各フレームに対しては一部のサブバンド変換係数のみを読み出せばよいため、従来技術で示されるようにm倍の速さでmフレームの全てについて全変換係数を読み出す必要がなく、第1の実施形態と同様、使用するメモリ容量や消費電力を低減させる効果も有する。
【0066】
本実施形態の方法も第1の実施形態と同様、2倍速再生に限らず、m倍速(mは2以上の整数)再生に適用可能であることは明らかである。
例えば、3倍速再生を行う場合には、図11に示すように処理を行えばよい。図10に示した2倍速再生時の処理と比較するとわかるように、3倍速再生時には、連続する3フレームの画像データの中からフレーム毎に互いに異なるサブバンド変換係数であって、かつ3フレームの各々から読み出したサブバンド変換係数を組み合わせて1フレーム分の全サブバンドのサブバンド変換係数が構成されるように読み出す点を除いて共通の処理が行われる。
【0067】
この例では、図11(a)に示すように、第1レベル(HL1、HH1、LH1)のサブバンド変換係数のサブバンド変換係数を読み出すフレームと、LL2を除く第2レベル(HL2、HH2、LH2)のサブバンド変換係数を読み出すフレームと、LL2サブバンド変換係数のみを読み出すフレームとを順次繰り返している。これにより、連続する3フレームから読み出したサブバンド変換係数から、一組の全サブバンドのサブバンド変換係数を得ることができる。
【0068】
各フレームから読み出されたサブバンド変換係数のデータ(図11(a))はエントロピ復号化部402により量子化された係数値に復号され、後続の逆量子化部403に出力される。逆量子化部403は、入力された係数値を逆量子化し、得られる離散ウェーブレット変換係数を復号用バッファメモリ部404に格納する。その後、図11(b)に示すように組み合わされた1画面分のサブバンド変換係数値は逆離散ウェーブレット変換部405によりベースバンドの画像データに変換される。その後、画像データは表示用バッファメモリ部406に入力され画像出力部407に可視画像として図11(c)のごとく出力される。
【0069】
このように、再生系400は、再生制御部408の制御に従い、3倍速再生においては図11(a)に示す各フレームの連続する3フレームから、図11(b)に示すように全サブバンドのサブバンド変換係数が得られ、かつ各フレームからは異なるサブバンドのサブバンド変換係数を読み出す。そして、図11(b)に示す合成フレームを作成し、ベースバンドの画像信号に復号し表示させる。連続する3フレームに対するこれらサブバンド係数の読み出し、合成及び復号処理を1フレーム区間(1/30)で行うことにより、図11(c)に示すように3倍速再生が実現できる。
【0070】
図11(c)に示すように、本実施形態における高速再生で表示される画像は、単純なフレーム間引き方法では完全に情報が欠落してしまう第nフレームや第(n+1)フレームの画像成分が第(n+2)フレームの再生画像に残像のように表示されるので、3倍速再生を表示させた場合にも自然な表示効果を得る事ができる。
【0071】
以降m倍速再生の場合も同様にして、mフレームの画像データからフレーム毎に異なるサブバンド変換係数のデータを読み出す制御を行う。そして、得られたサブバンド係数を逆離散ウェーブレット変換部405によりベースバンドの画像データに変換する事によって高周波成分の残像効果が得られ、フレーム間の動きが大きくても視覚的な違和感の少ないm倍速再生を行う事ができる。
【0072】
以上説明したように、本実施形態によれば、複数の周波数帯域成分毎に圧縮符号化された画像を高速再生する際に、再生する1フレーム分の画像を表すサブバンド変換係数を、複数の連続するフレームのサブバンド変換係数から重複無く生成することにより、簡便な処理で、かつフレーム間の動きによらず、視覚的に違和感の少ないなめらかな高速再生が可能になる。
【0073】
【他の実施形態】
上述の第1及び第2の実施形態を組み合わせることも可能である。この場合、例えば第2の実施形態において、m倍速再生時に連続するmフレームのデータから読み出すサブバンド変換係数の一部が重複するように読み出し制御を行い、復号用メモリバッファ部404内での合成/組立処理において、重複したサブバンド変換係数に対して第1の実施形態で行った加重平均処理を行うことで、1つの合成フレームを生成すればよい。
【0074】
また本実施形態では画像を複数の周波数帯域に分割して画像を圧縮する処理として離散ウェーブレット変換を用いたJPEG2000方式を例に説明したが、画像信号を複数の周波数帯域に分割して圧縮を行う圧縮方法であれば本発明を適用することが可能であり、圧縮方式自体に特に制限は無い。
【0075】
さらに、上述の実施形態においては、説明及び本発明の理解を容易にするため、2レベルの2次元離散ウェーブレット変換を用いて圧縮符号化された画像データを例にして説明したが、3レベル以上の変換がなされていても構わない。
【0076】
上述の実施形態においては、1つの機器から構成される画像再生装置についてのみ説明したが、同等の機能を複数の機器から構成されるシステムによって実現しても良い。
【0077】
尚、前述した実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いて当該プログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを実行することによって同等の機能が達成される場合も本発明に含む。
【0078】
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。
【0079】
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
【0080】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気記録媒体、MO、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−R、DVD−RW等の光/光磁気記憶媒体、不揮発性の半導体メモリなどがある。
【0081】
有線/無線通信を用いたプログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイル等、クライアントコンピュータ上で本発明を形成するコンピュータプログラムとなりうるデータファイル(プログラムデータファイル)を記憶し、接続のあったクライアントコンピュータにプログラムデータファイルをダウンロードする方法などが挙げられる。この場合、プログラムデータファイルを複数のセグメントファイルに分割し、セグメントファイルを異なるサーバに配置することも可能である。
【0082】
つまり、本発明の機能処理をコンピュータで実現するためのプログラムデータファイルを複数のユーザに対してダウンロードさせるサーバ装置も本発明に含む。
【0083】
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件を満たしたユーザに対して暗号化を解く鍵情報を、例えばインターネットを介してホームページからダウンロードさせることによって供給し、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
【0084】
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
【0085】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
【0086】
【発明の効果】
以上説明したように本発明によれば、複数の周波数帯域に分割されて記録された画像を高速に再生する際に、少なくとも1部のフレームについては、一部のサブバンド変換係数のみを読み出すようにすることで、情報の欠落するフレームなく高速再生を行うことが可能となり、フレーム間で動きのある画像を高速再生する場合あっても視覚的に違和感の少ないなめらかな再生出力が可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る記録再生装置の記録系構成例を示すブロック図である。
【図2】図1における離散ウェーブレット変換部106の構成例を示す図である。
【図3】図1における量子化部107の入出力特性例を示す図である。
【図4】本発明の実施形態に係る記録再生装置の再生系構成例を示すブロック図である。
【図5】図4における逆離散ウェーブレット変換部405の構成例を示す図である。
【図6】本発明の実施形態における通常再生時の各フレームのサブバンド変換係数と復号・再生される画像との関係を説明する図である。
【図7】第1の実施形態において、2倍速再生時に各フレームから読み出されるサブバンド変換係数と、復号・再生される画像との関係を説明する図である。
【図8】第1の実施形態において、3倍速再生時に各フレームから読み出されるサブバンド変換係数と、復号・再生される画像との関係を説明する図である。
【図9】第1の実施形態の変形例において、2倍速再生時に各フレームから読み出されるサブバンド変換係数と、復号・再生される画像との関係を説明する図である。
【図10】第2の実施形態において、2倍速再生時に各フレームから読み出されるサブバンド変換係数と、復号・再生される画像との関係を説明する図である。
【図11】第2の実施形態において、3倍速再生時に各フレームから読み出されるサブバンド変換係数と、復号・再生される画像との関係を説明する図である。
【図12】フレーム間で動きのある画像の例を示す図である。
【図13】従来の方法によって図12の画像を高速再生した状態を模式的に示す図である。
【符号の説明】
101:レンズ部
102:撮像換
103:メモリ部
104:画像データ作成部
105:カメラ制御部
106:離散ウェーブレット変換部
107:量子化部
108:エントロピ符号化部
109:画像符号化データ出力部
110:記録装置
401:符号読み出し部
402:エントロピ複合化部
403:逆量子化部
404:復号用バッファメモリ部
405:逆離散ウェーブレット変換部
406:表示用バッファメモリ部
407:画像出力部
408:再生制御部
409:操作スイッチ[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an image reproduction technique, and more particularly to an image reproduction technique capable of reproducing an image at high speed.
[0002]
[Prior art]
Conventionally, when reproducing temporally continuous image data such as moving image data, for example, a desired content can be searched in a short time, or the overall flow can be roughly grasped. There is a demand for performing regeneration.
[0003]
An image reproducing apparatus having such a high-speed reproducing function has also been realized. In general, a moving image is a set of images for one screen called a frame. Therefore, a high-speed reproduction function can be realized by performing thinning-out reproduction such as reproducing recorded frames every few frames.
[0004]
However, when such thinning-out reproduction is performed, as the reproduction speed increases (that is, as the number of frames to be thinned out increases), the reproduced moving image becomes jerky, and the visual characteristics cannot be said to be good.
[0005]
As a high-speed reproduction method with improved visual characteristics, for example,
[0006]
[0007]
[Patent Document 1]
JP-A-7-162851
[Patent Document 2]
JP 2001-352524 A
[0008]
[Problems to be solved by the invention]
The high-speed reproduction method proposed in these patent documents can visually and smoothly display the motion of an image even during high-speed reproduction, as compared with simple frame thinning. However, in each of these proposals, a plurality of frame images are sliced (divided) into a rectangular shape, and a slice image of each image is combined to form a composite image for one frame. The mixed images are mixed.
[0009]
For this reason, when a composite image is generated from four frames of images having motion between frames as shown in FIG. 12, the composite image has a shift as shown in FIG. 13, and the reproduced image is visually unfavorable.
[0010]
Further, in order to perform high-speed reproduction while generating such a composite image, it is necessary to read, combine, and reproduce a plurality of images within a normal reproduction processing time for one frame. In some cases, it has increased or required a large amount of resources such as a memory. For example, in the method proposed in
[0011]
SUMMARY OF THE INVENTION The present invention has been made in view of such problems of the related art, and an object of the present invention is to provide an image reproducing apparatus capable of performing a simple process and performing a smooth display even at a high-speed reproduction regardless of the size of the motion. To provide.
[0012]
[Means for Solving the Problems]
In order to achieve the above object, an image reproducing apparatus according to the present invention is an image reproducing apparatus which performs band synthesis on image data recorded by being divided into a plurality of frequency band components and outputs the image data. An acquisition unit, a reproduction output unit configured to perform band synthesis on the acquired image data, and a control unit configured to control the data acquisition unit and the reproduction output unit in accordance with a reproduction condition. Is an integer of 2 or more). When one image is band-synthesized and reproduced and output from the image data constituting the two images, the data acquisition unit performs the processing from each of the image data constituting the (m-1) images. The data of some frequency band components among the plurality of frequency band components, and the data of at least some of the frequency band components of the plurality of frequency band components are obtained from the image data constituting the remaining one image. Each is acquired, the reproduction output means, based on those acquired data, one image and band synthesis, and controls to output.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, the present invention will be described in detail based on preferred embodiments with reference to the accompanying drawings.
■ (First embodiment)
FIG. 1 is a block diagram showing a configuration example of a recording system 100 in a recording / reproducing apparatus as an example of an image reproducing apparatus of the present invention, and FIG. 4 is a block diagram showing a configuration example of a reproducing system 400 of the same apparatus. .
[0014]
■ (Configuration of the recording system 100)
First, the configuration and operation of the recording system 100 will be described with reference to FIG. In FIG. 1,
[0015]
■ (Operation of the recording system 100)
Light incident through the
[0016]
The image
[0017]
In the present embodiment, as the image compression / encoding processing performed by the image compression unit 120, a description will be given assuming that image data is divided into a plurality of bands and compression / encoding processing conforming to the so-called JPEG2000 system for performing compression / decompression is performed. Since the JPEG2000 compression encoding method is described in detail in ISO / IEC15444, only the parts necessary for understanding the present embodiment will be described here.
[0018]
The image data created by the image
[0019]
FIG. 2A is a diagram illustrating a configuration example of the discrete
[0020]
In FIG. 2A, the conversion processing in the horizontal direction and the vertical direction is performed on the input multi-valued image signal of the baseband as one set. Further, after the first set of processing is completed, the same processing is repeatedly performed on the signal (LL1) having the lowest frequency band, thereby finally outputting a series of data belonging to seven different frequency bands.
[0021]
FIG. 2B illustrates a state in which the input multi-valued image signal is divided into different frequency bands (sub-bands) as a result of performing the conversion processing in the discrete
[0022]
The subband transform coefficients output from the discrete
[0023]
The
[0024]
■ (Configuration of reproduction system 400)
Next, the reproduction system 400 of the recording / reproduction device according to the present embodiment will be described. FIG. 4 is a block diagram showing a configuration example of a reproduction system 400 that expands and reproduces image data encoded by the recording system 100 shown in FIG.
[0025]
4,
[0026]
■ (Operation during normal playback)
First, the operation during normal reproduction (constant speed reproduction) will be described. The image data compressed and encoded by the recording system 100 and recorded in the
[0027]
After that, the
[0028]
Next, with reference to FIG. 5 showing a detailed configuration example of the inverse discrete
[0029]
The inverse discrete
[0030]
The inverse discrete
[0031]
By performing the above processing at all levels, baseband image data can be decoded. The baseband image data combined by the inverse discrete
[0032]
As described above, at the time of normal reproduction, the
[0033]
■ (Operation during high-speed playback)
Next, an operation for performing high-speed reproduction (search) using the reproduction system 400 of FIG. 4 will be described.
For example, when an instruction for high-speed reproduction (here, double-speed reproduction) is given from the
[0034]
That is, at the time of normal reproduction, the conversion coefficients of all the sub-bands are read out for each frame and demodulated and reproduced, but at the time of high-speed reproduction, the sub-band conversion coefficients of all the sub-bands and the sub-band conversion coefficients of some sub-bands are read. There is a frame to read only. In the present embodiment, when the reproduction at the m-times speed (m is an integer of 2 or more) is instructed, the subband conversion coefficients of all the subbands are read out only for one frame every m frames, and the remaining (m-1) frames are read. For, only the sub-band transform coefficients of the LL sub-band at the lowest level (
[0035]
Since the playback is now double speed, as shown in FIG. 7A, a frame (n, n + 2, n + 4) for reading only the LL2 subband conversion coefficient and a frame (n + 1, n + 3) for reading all the subband conversion coefficients are used. n + 5) are present alternately. Since the time required to read only the LL2 sub-band transform coefficients is sufficiently shorter than reading the transform coefficients of all the sub-bands, m-times playback as described in
[0036]
In order to read only the LL2 sub-band conversion coefficient, the header of the recorded image data is analyzed, and the sub-band conversion coefficient data of the sub-band (shaded area) other than the
[0037]
The read data of each subband transform coefficient decodes the coefficient value quantized by the
[0038]
After that, the
[0039]
In the present embodiment, the synthesized frame is generated by weighted averaging the LL2 subband conversion coefficient of the frame from which the conversion coefficients of all the subbands have been read and the LL2 subband conversion coefficient of the remaining (m-1) frames.
[0040]
That is, as shown in FIG. 7B, the LL2 component LL2 (n + 1) of the (n + 1) th frame and the LL2 component LL2 (n) of the nth frame are multiplied by predetermined weighting factors α and β, respectively, and added. Then, LL (n + 1) ′, which is the LL subband transform coefficient after synthesis, is calculated. That is,
LL (n + 1) '= α × LL (n + 1) + β × LL (n)
Is performed.
[0041]
In the present embodiment, the coefficients α and β satisfy the relationship of α + β = 1.0. Therefore, for example, when combining by taking a simple average value, α = 0.5 and β = 0.5, and when it is desired to emphasize the LL component of the (n + 1) th frame, for example, α = 0. 7. A coefficient value is determined so that α> β such as β = 0.3, and a weighted average calculation is performed. The sub-band transform coefficient values for one frame in which the LL sub-band transform coefficients are weighted and averaged are converted by the inverse discrete
[0042]
As described above, according to the control of the
[0043]
As shown in FIG. 7C, the image displayed by the high-speed reproduction according to the present embodiment includes the image components of the nth frame and the (n + 2) th frame in which the information is completely lost by the simple frame thinning method. Since the after-image is displayed on the reproduced images of the (n + 1) -th and (n + 3) -th frames, respectively, a natural display effect can be obtained even when the double-speed reproduction is displayed.
[0044]
Further, as described above, in the present embodiment, when reading out the sub-band conversion coefficients recorded in the recording apparatus, one of the m successive frames recorded during m-times speed reproduction is one sub-band of all sub-bands. The transform coefficients are read out, and only some of the sub-band transform coefficients (the LL2 sub-band transform coefficients in the present embodiment) need to be read out for the (m-1) thinned-out frames. Therefore, it is not necessary to read out all the conversion coefficients for all of the m frames, which has the effect of reducing the memory capacity used and the power consumption.
[0045]
It is clear that such a high-speed reproduction method is applicable not only to 2 × -speed reproduction but also to m × -speed (m is an integer of 2 or more) reproduction.
For example, in the case of performing triple speed reproduction, the processing may be performed as shown in FIG. As can be seen from comparison with the processing at the time of 2 × speed reproduction shown in FIG. 7, at the time of 3 × speed reproduction, two out of three consecutive frames are frames from which only the LL2 subband conversion coefficient is read, and the LL2 subband of three frames A common process is performed except that the transform coefficients are weighted and averaged.
[0046]
As shown in FIG. 8B, the weighted averaging operation in the decoding
LL2 (n + 2) '= α × LL2 (n + 2) + β × LL2 (n + 1) + γ × LL2 (n)
Is required.
[0047]
In this case, α + β + γ = 1.0. For example, when a simple average value is calculated, α = 0.33, β = 0.33, and γ = 0.33. To emphasize the LL component of the (n + 2) th frame, for example, α = 0.5 , Β = 0.3 and γ = 0.2 to perform the calculation of the weighted average. Each of the weighted averaged subband transform coefficient values is converted into baseband image data by the inverse discrete
[0048]
By reading, combining, and decoding the subband coefficients for three consecutive frames in one frame period (1/30), triple-speed reproduction can be realized.
[0049]
Also in the display image shown in FIG. 8C, the image component of the nth frame or the (n + 1) th frame, for which the information has been completely lost by the conventional simple frame thinning method, is the decoded image of the (n + 2) th frame. In this case, the image is displayed as an afterimage, and even when 3 × speed reproduction is displayed, the reproduction display can be performed with a natural feeling.
[0050]
Thereafter, similarly, in the case of m-times speed reproduction, a weighted average calculation of LL components for m frames is performed using m weighted average coefficients, and the obtained subband coefficients are converted into baseband coefficients by the inverse discrete
[0051]
(1) (Modification of the first embodiment)
In the above-described example, for a frame (thinned-out frame) from which only a part of the sub-band transform coefficients are read, only the LL2 sub-band transform coefficient is read, and a composite frame is generated by weighted averaging of the LL2 sub-band transform coefficients. .
However, the type and number of subband conversion coefficients to be read out for a thinned frame can be arbitrarily set as long as they are not all the subband coefficients.
[0052]
That is, as shown in FIGS. 9A and 9B, in addition to the LL2 subband conversion coefficients, the subband conversion coefficients HL2, LH2, and HH2 are also read out, and these subband conversion coefficients are weighted average. Alternatively, a composite frame may be generated and reproduced.
In this case, the weighted average calculation is performed in subband units. Although FIG. 9 shows the case of 2 × speed reproduction, the same processing may be performed in 3 × or higher speed reproduction.
[0053]
As described above, according to the present embodiment, when high-speed playback of an image that has been compression-encoded for each of a plurality of frequency band components, a part of the sub-band transform coefficient representing the image of one frame to be played back is used. By generating from the subband transform coefficients of a plurality of consecutive frames, smooth high-speed reproduction with a simple process and with little visual discomfort can be performed regardless of the movement between frames.
[0054]
■ (Second embodiment)
In the first embodiment, a combined frame is generated by weighted averaging of subband transform coefficients common to each frame to be combined. On the other hand, the present embodiment is characterized in that different subband transform coefficients are read from each frame to be synthesized and one synthesized frame is generated.
[0055]
Note that the high-speed reproduction method described in the present embodiment can also be performed by the recording / reproducing apparatus described in the first embodiment, and a description of the configuration of the recording / reproducing apparatus will be omitted. Also, the processing at the time of reproduction at the normal speed is common to that of the first embodiment, and therefore, only the operation at the time of high-speed reproduction will be described below.
[0056]
As in the first embodiment, first, double speed reproduction will be described. For example, when there is an instruction to perform double-speed playback from the
[0057]
That is, at the time of normal reproduction, the conversion coefficients of all sub-bands are read out for each frame and demodulated and reproduced. At the time of high-speed reproduction, the sub-band conversion coefficients are read out for sub-bands different from each other in the frame to be synthesized. In the present embodiment, when m-times speed reproduction (m is an integer of 2 or more) is instructed, subband conversion coefficients of subbands different from each other from consecutive m frames, and Reading is performed so that sub-band conversion coefficients for all types of sub-bands can be obtained by the band conversion coefficients.
[0058]
Therefore, at the time of 2 × speed reproduction, as shown in FIGS. 10A and 10B, for example, as shown in FIGS. 10A and 10B, the second level (LL2, HL2, HH2, LH2) starts from one frame of the coded image data of two consecutive frames. The sub-band conversion coefficients are required to read out the sub-band conversion coefficients of the first level (HL1, HH1, LH1) from the other frame to synthesize one frame from the image data of two consecutive frames. Sub-band transform coefficients of all the sub-bands are obtained.
[0059]
That is, with respect to the n-th frame and the (n + 1) -th frame, the HL1 (n), HH1 (n), and LH1 (n) sub-band conversion coefficient data are read for the image data of the n-th frame, and the following (n + 1) -th ) With respect to the image data of the frame, the subband conversion coefficient data of LL2 (n + 1), HL2 (n + 1), HH2 (n + 1), LH2 (n + 1) is read.
[0060]
As described above, data of different subband conversion coefficients are read from image data of two consecutive frames so that all the subband conversion coefficients for one screen are combined as shown in FIG. 10B.
[0061]
The read data of each subband transform coefficient decodes the coefficient value quantized by the
[0062]
Thereafter, the subband transform coefficient values for one screen combined as shown in FIG. 10B are converted into baseband image data by the inverse discrete
[0063]
As described above, under the control of the
[0064]
As shown in FIG. 10C, the image displayed by the high-speed reproduction according to the present embodiment includes the image components of the nth frame and the (n + 2) th frame in which the information is completely lost by the simple frame thinning method. Since the after-image is displayed on the reproduced images of the (n + 1) -th and (n + 3) -th frames, respectively, a natural display effect can be obtained even when the double-speed reproduction is displayed.
[0065]
In this embodiment, at the time of m-times speed reproduction, when reading out the sub-band transform coefficients recorded in the recording device, the header of the data is analyzed, and sub-bands different from each other are selected from the m successive image data. The sub-band transform coefficients of all the sub-bands for one frame are read by combining the transform coefficients and the different sub-band transform coefficients read from the m frames. Therefore, since it is only necessary to read out some sub-band transform coefficients for each frame, it is not necessary to read out all the transform coefficients for all of the m frames at a speed of m times as shown in the related art. As in the first embodiment, there is also an effect of reducing the used memory capacity and power consumption.
[0066]
It is clear that the method of the present embodiment can be applied not only to 2 × speed reproduction but also to m × speed (m is an integer of 2 or more) reproduction as in the first embodiment.
For example, in the case of performing the triple speed reproduction, the processing may be performed as shown in FIG. As can be seen from a comparison with the processing at the time of 2 × speed reproduction shown in FIG. 10, at the time of 3 × speed reproduction, different subband conversion coefficients are used for each frame from among three consecutive frames of image data. The common processing is performed except that the sub-band transform coefficients read from each are read out so as to form the sub-band transform coefficients of all the sub-bands for one frame.
[0067]
In this example, as shown in FIG. 11A, the frame from which the sub-band transform coefficients of the first-level (HL1, HH1, LH1) sub-band transform coefficients are read, and the second levels (HL2, HH2, The frame for reading out the subband conversion coefficient of LH2) and the frame for reading out only the LL2 subband conversion coefficient are sequentially repeated. This makes it possible to obtain the subband conversion coefficients of one set of all subbands from the subband conversion coefficients read from three consecutive frames.
[0068]
The data (FIG. 11A) of the sub-band transform coefficient read from each frame is decoded into a coefficient value quantized by the
[0069]
As described above, according to the control of the
[0070]
As shown in FIG. 11C, the image displayed by the high-speed reproduction according to the present embodiment has image components of the n-th frame and the (n + 1) -th frame in which information is completely lost by a simple frame thinning method. Since the reconstructed image of the (n + 2) -th frame is displayed as an afterimage, a natural display effect can be obtained even when 3 × speed reproduction is displayed.
[0071]
Thereafter, in the case of m-times speed reproduction, control for reading out data of subband conversion coefficients different for each frame from image data of m frames is performed in the same manner. By converting the obtained subband coefficients into baseband image data by the inverse discrete
[0072]
As described above, according to the present embodiment, when an image compressed and encoded for each of a plurality of frequency band components is reproduced at high speed, a subband transform coefficient representing an image for one frame to be reproduced is converted into a plurality of subband transform coefficients. By generating without duplication from the subband transform coefficients of consecutive frames, smooth high-speed reproduction with simple processing and with little visual discomfort can be performed regardless of the movement between frames.
[0073]
[Other embodiments]
It is also possible to combine the first and second embodiments described above. In this case, for example, in the second embodiment, read control is performed so that a part of subband transform coefficients read from data of continuous m frames at the time of m-times speed reproduction is overlapped, and synthesis in the decoding
[0074]
In the present embodiment, the JPEG2000 system using discrete wavelet transform has been described as an example of a process of dividing an image into a plurality of frequency bands and compressing the image. However, the image signal is divided into a plurality of frequency bands and compressed. The present invention can be applied to any compression method, and there is no particular limitation on the compression method itself.
[0075]
Furthermore, in the above-described embodiment, for ease of explanation and understanding of the present invention, image data compressed and encoded using a two-level two-dimensional discrete wavelet transform has been described as an example. May be converted.
[0076]
In the above-described embodiment, the description has been given only of the image reproducing apparatus including one device. However, the same function may be realized by a system including a plurality of devices.
[0077]
In addition, a software program for realizing the functions of the above-described embodiments is supplied to a system or an apparatus having a computer capable of executing the program directly from a recording medium or by using wired / wireless communication. The present invention includes a case where a computer achieves the same function by executing the supplied program.
[0078]
Therefore, the program code itself supplied and installed in the computer to implement the functional processing of the present invention by the computer also implements the present invention. That is, the present invention includes the computer program itself for implementing the functional processing of the present invention.
[0079]
In this case, any form of the program, such as an object code, a program executed by an interpreter, and script data to be supplied to the OS, may be used as long as the program has a function.
[0080]
As a recording medium for supplying the program, for example, a magnetic recording medium such as a flexible disk, a hard disk, a magnetic tape, an MO, a CD-ROM, a CD-R, a CD-RW, a DVD-ROM, a DVD-R, a DVD- There are optical / magneto-optical storage media such as RW, and nonvolatile semiconductor memories.
[0081]
As a method for supplying a program using wired / wireless communication, a computer program itself that forms the present invention on a server on a computer network, or a computer that forms the present invention on a client computer, such as a compressed file having an automatic installation function, etc. A method of storing a data file (program data file) that can be a program and downloading the program data file to a connected client computer may be used. In this case, the program data file can be divided into a plurality of segment files, and the segment files can be arranged on different servers.
[0082]
That is, the present invention also includes a server device that allows a plurality of users to download a program data file for implementing the functional processing of the present invention on a computer.
[0083]
Further, the program of the present invention is encrypted, stored in a storage medium such as a CD-ROM and distributed to users, and key information for decrypting the encryption for a user who satisfies predetermined conditions is transmitted to, for example, a homepage via the Internet. It is also possible to realize the program by supplying it by downloading it from, and using the key information to execute an encrypted program and install it on a computer.
[0084]
The functions of the above-described embodiments are implemented when the computer executes the read program, and an OS or the like running on the computer executes a part of the actual processing based on the instructions of the program. Alternatively, all the operations are performed, and the functions of the above-described embodiments can be realized by the processing.
[0085]
Further, after the program read from the recording medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion board or the The CPU or the like provided in the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments can also be realized by the processing.
[0086]
【The invention's effect】
As described above, according to the present invention, when reproducing an image divided into a plurality of frequency bands and recorded at a high speed, at least a part of the frame is read out of only a part of the subband transform coefficients. By doing so, high-speed reproduction can be performed without frames in which information is lost, and even in the case of high-speed reproduction of an image having motion between frames, smooth reproduction output with little visual discomfort can be realized.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of a recording system of a recording / reproducing apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating a configuration example of a discrete
FIG. 3 is a diagram illustrating an example of input / output characteristics of a
FIG. 4 is a block diagram showing a configuration example of a reproducing system of the recording / reproducing apparatus according to the embodiment of the present invention.
FIG. 5 is a diagram illustrating a configuration example of an inverse discrete
FIG. 6 is a diagram illustrating a relationship between subband transform coefficients of each frame and an image to be decoded / reproduced during normal reproduction according to the embodiment of the present invention.
FIG. 7 is a diagram illustrating the relationship between subband transform coefficients read from each frame during double-speed playback and images to be decoded and played back in the first embodiment.
FIG. 8 is a diagram illustrating a relationship between subband transform coefficients read from each frame during triple-speed playback and decoded / reproduced images in the first embodiment.
FIG. 9 is a diagram illustrating the relationship between subband transform coefficients read from each frame during double-speed playback and decoded / reproduced images in a modification of the first embodiment.
FIG. 10 is a diagram illustrating a relationship between subband transform coefficients read from each frame during double-speed playback and decoded / reproduced images in the second embodiment.
FIG. 11 is a diagram illustrating the relationship between subband transform coefficients read from each frame during triple-speed playback and decoded / reproduced images in the second embodiment.
FIG. 12 is a diagram illustrating an example of an image having motion between frames.
FIG. 13 is a diagram schematically showing a state in which the image of FIG. 12 is reproduced at a high speed by a conventional method.
[Explanation of symbols]
101: Lens unit
102: Image change
103: Memory section
104: Image data creation unit
105: Camera control unit
106: discrete wavelet transform unit
107: Quantization unit
108: Entropy coding unit
109: Image encoded data output unit
110: Recording device
401: code reading unit
402: Entropy compounding unit
403: inverse quantization unit
404: decoding buffer memory unit
405: inverse discrete wavelet transform unit
406: display buffer memory unit
407: Image output unit
408: Playback control unit
409: Operation switch
Claims (11)
前記画像データを取得するデータ取得手段と、
前記取得した画像データを帯域合成して出力する再生出力手段と、
再生条件に応じて前記データ取得手段及び前記再生出力手段を制御する制御手段を有し、
前記制御手段は、連続するm(mは2以上の整数)枚の画像を構成する画像データから1枚の画像を帯域合成して再生出力する場合、
前記データ取得手段によって、(mー1)枚の画像を構成する画像データの各々からは、前記複数の周波数帯域成分のうち一部の周波数帯域成分のデータを、残りの1枚の画像を構成する画像データからは、前記複数の周波数帯域成分の少なくとも一部の周波数帯域成分のデータをそれぞれ取得させ、
前記再生出力手段が、当該取得したデータに基づいて、前記1枚の画像を帯域合成し、出力するように制御することを特徴とする画像再生装置。An image reproducing apparatus for performing band synthesis on image data recorded by being divided into a plurality of frequency band components and outputting the data,
Data acquisition means for acquiring the image data,
A reproduction output unit that outputs the acquired image data by performing band synthesis,
Control means for controlling the data acquisition means and the reproduction output means according to reproduction conditions,
The control means, when performing band reproduction of one image from image data constituting continuous m (m is an integer of 2 or more) images and reproducing and outputting,
The data acquisition unit forms, from each of the image data constituting the (m−1) images, data of a part of the plurality of frequency band components and data of the remaining one image. From the image data to be obtained, the data of at least a part of the frequency band components of the plurality of frequency band components, respectively,
An image reproducing apparatus, wherein the reproduction output means controls the band synthesis of the one image based on the acquired data and outputs the resultant image.
前記データ取得手段によって、前記(m−1)枚の画像を構成する画像データの各々からは同一の周波数帯域成分のデータを、前記残りの1枚の画像を構成する画像データからは、前記複数の周波数帯域成分の全ての周波数帯域成分のデータを取得させることを特徴とする請求項1記載の画像再生装置。In the case where the control means performs band reproduction of one image from image data constituting the continuous m (m is an integer of 2 or more) images and reproduces and outputs the image,
The data acquisition unit converts the data of the same frequency band component from each of the image data constituting the (m-1) images, and converts the data of the plurality of 2. The image reproducing apparatus according to claim 1, wherein data of all the frequency band components of the frequency band components is acquired.
前記撮影した画像を複数の周波数成分に分割して記録する変換手段とを有することを特徴とする請求項1乃至請求項8のいずれか1項に記載の画像再生装置。Further, means for taking an image,
The image reproducing apparatus according to claim 1, further comprising a conversion unit configured to divide the photographed image into a plurality of frequency components and record the divided image.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003032267A JP2004242250A (en) | 2003-02-10 | 2003-02-10 | Image playback device |
US10/701,504 US7706583B2 (en) | 2002-11-11 | 2003-11-06 | Image processing apparatus and method |
CN200310113275.8A CN1263290C (en) | 2002-11-11 | 2003-11-10 | Image processor and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003032267A JP2004242250A (en) | 2003-02-10 | 2003-02-10 | Image playback device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004242250A true JP2004242250A (en) | 2004-08-26 |
Family
ID=32958559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003032267A Withdrawn JP2004242250A (en) | 2002-11-11 | 2003-02-10 | Image playback device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004242250A (en) |
-
2003
- 2003-02-10 JP JP2003032267A patent/JP2004242250A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8005309B2 (en) | Image coding apparatus, image decoding apparatus, image display apparatus and image processing apparatus | |
TWI436287B (en) | Method and apparatus for coding image | |
JP2004221999A (en) | Image processing method | |
JP4124792B2 (en) | Encoding method, decoding method, encoding device, and decoding device | |
WO2003001695A1 (en) | Method and apparatus for real-time editing of plural content streams | |
KR20150010903A (en) | Method And Apparatus For Generating 3K Resolution Display Image for Mobile Terminal screen | |
JP2002034043A (en) | Method and device for coding and recording medium | |
US20040013312A1 (en) | Moving image coding apparatus, moving image decoding apparatus, and methods therefor | |
JPH09322165A (en) | Image decoding device and method, and image reproducing device | |
JP3501213B2 (en) | Video device and recoder used therefor | |
WO2006046550A1 (en) | Image encoding method and device, image decoding method, and device | |
US7706583B2 (en) | Image processing apparatus and method | |
JP4155566B2 (en) | Image reproducing apparatus and method | |
JP2004242250A (en) | Image playback device | |
JP2004214985A (en) | Image processor and image reproducing device | |
JP4251610B2 (en) | Image processing device | |
JP2004165800A (en) | Image processing apparatus | |
JP4667424B2 (en) | Image decoding device | |
JP2004349939A (en) | Method and device for image encoding and recording device | |
JP3869303B2 (en) | Image decoding method and apparatus | |
JP4194311B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, and methods thereof | |
JP4174254B2 (en) | Moving picture encoding apparatus, moving picture decoding apparatus, and methods thereof | |
JP2004135107A (en) | Image processing apparatus and method | |
JPH10215454A (en) | Encoding device and method | |
JPH09182074A (en) | Image signal encoding method and device therefor and image signal decoding method and device therefor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060509 |