JP4760902B2 - 情報処理装置および方法 - Google Patents

情報処理装置および方法 Download PDF

Info

Publication number
JP4760902B2
JP4760902B2 JP2008321221A JP2008321221A JP4760902B2 JP 4760902 B2 JP4760902 B2 JP 4760902B2 JP 2008321221 A JP2008321221 A JP 2008321221A JP 2008321221 A JP2008321221 A JP 2008321221A JP 4760902 B2 JP4760902 B2 JP 4760902B2
Authority
JP
Japan
Prior art keywords
image data
precinct
unit
data
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008321221A
Other languages
English (en)
Other versions
JP2010147678A (ja
Inventor
星 砂原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008321221A priority Critical patent/JP4760902B2/ja
Priority to US12/580,440 priority patent/US8391616B2/en
Priority to EP20090179442 priority patent/EP2200325B1/en
Priority to CN2009102537975A priority patent/CN101754018B/zh
Publication of JP2010147678A publication Critical patent/JP2010147678A/ja
Application granted granted Critical
Publication of JP4760902B2 publication Critical patent/JP4760902B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/507Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction using conditional replenishment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Automatic Analysis And Handling Materials Therefor (AREA)

Description

本発明は、情報処理装置および方法に関し、特に、画像データ伝送において画質劣化を抑制しながら伝送帯域を節約することができるようにした情報処理装置および方法に関する。
デジタルビデオ通信において、帯域幅の制限から画像を圧縮して伝送することは一般的であるが、この際の圧縮方式としては大きく2つに分けることができる。一方は、画像間の関連性を利用するイントラフレーム圧縮であり、他方は、画像間の関連性は利用しないインターフレーム圧縮である。
前者には、例えばMPEG(Moving Picture Experts Group)方式がある。この圧縮方式の場合、画像のうち、変化のある部分だけにデータを割り当てることによって高い圧縮率を期待できる半面、データに誤りがあった場合にはその影響がしばらく継続するといった欠点がある。
後者には、例えばJPEG(Joint Photographic Experts Group)2000方式がある。この圧縮方式の場合、相関を利用しないため、圧縮率に関してはイントラフレームに及ばないが、データに誤りがあった場合の影響は継続せず、該当する画像のみとなる。
ところで、近年、インターネット若しくはその他の伝送路を経由して、マルチメディアデータを低遅延に伝送するという需要が高まっている。例えば、遠隔地2地点の医療拠点をインターネット等で接続し、一方の遠隔手術室から手術風景を動画像伝送し、他方からその映像を見ながら遠隔手術室の手術器具を操作するといった、所謂遠隔手術用アプリケーションがある。このようなアプリケーションでは、数フレーム間隔以下の遅延での動画像伝送が要求される。
このような要求に対して、動画像の各ピクチャの数ライン毎を1つの圧縮符号化ブロックとしてウェーブレット変換による圧縮符号化を行う方式が提案された(例えば、特許文献参照)。この方式の場合、符号化装置は、ピクチャ内のデータ全てが入力される前に圧縮符号化を開始することができる。また、圧縮データをネットワーク経由で伝送し、受信側でその圧縮データを復号する場合、復号装置は、ピクチャ内の全てのデータを受信する前に復号処理を開始することができる。したがって、ネットワーク伝播遅延が十分小さければ、フレーム間隔以下の遅延でのリアルタイム動画像伝送が可能となる。
特開2007−311924号公報
しかしながら、インターフレーム方式の場合、上述したように高いエラー耐性を得やすい反面、伝送に必要な帯域幅が大きくなる恐れがあった。また、そのため、一般的な通信回線の場合、その通信回線の利用可能な帯域のほとんどを、画像データ(符号化データ)の転送のために確保する必要があり、例えば、エラー訂正用の冗長符号やその他の制御信号を同時に伝送させることが困難になる恐れがあった。換言すれば、エラー訂正用の冗長符号やその他の制御信号を同時に伝送させるためには、画質を犠牲にする必要があった。
本発明はこのような問題を解決するためのものであり、送信側で送信データの一部を適切に選択して破棄することにより、画像データ伝送において画質劣化を抑制しながら伝送に必要な帯域幅を低減させるものである。
本発明の一側面は、画像データを低域成分と高域成分に分割する処理を再帰的に繰り返すフィルタ処理において最終分割レベルの係数を1ライン生成するために必要なライン数分の画像データであるプレシンクトを処理単位とし、処理対象のプレシンクトの画像データである処理対象画像データと、前記処理対象のプレシンクトに対して所定の相対位置に位置するプレシンクトの画像データであり、前記処理対象画像データより以前に処理される基準画像データとの類似度を求め、前記類似度が所定の閾値に達しているか否かによって、前記処理対象画像データが前記基準画像データと類似しているか否かを求める解析処理を行う解析手段と、前記解析手段により解析された前記処理対象画像データを記憶する記憶手段と、前記処理対象画像データを符号化する符号化手段と、前記解析手段による解析の結果、前記処理対象画像データが前記基準画像データと類似している場合、前記処理対象画像データを破棄する破棄手段と、前記解析手段による解析の結果、前記処理対象画像データが前記基準画像データと類似していない場合、前記符号化手段により前記処理対象画像データが符号化されて生成された符号化データを送信する送信手段とを備え、前記解析手段は、前記記憶手段に記憶されている画像データを取得し、取得した前記画像データを前記基準画像データとして前記解析処理を行う情報処理装置である。
前記相対位置は、前記処理対象のプレシンクトと同じピクチャの、前記処理対象のプレシンクトに隣接し、前記処理対象のプレシンクトの1つ前に処理されるプレシンクトであるようにすることができる。
前記相対位置は、前記処理対象のプレシンクトと同じピクチャの、前記処理対象のプレシンクト近傍の、前記処理対象のプレシンクトより数プレシンクト前に処理されるプレシンクトであるようにすることができる。
前記相対位置は、前記処理対象のプレシンクトのピクチャより時間的に前のピクチャの、前記処理対象のプレシンクトと同じ位置のプレシンクトであるようにすることができる。
前記解析手段は、前記処理対象画像データと、前記相対位置が互いに異なる複数の前記基準画像データとの類似度を求めることができる。
前記記憶手段は、記憶する画像データを削除する場合、前記解析手段により使用される可能性の無い、若しくは、使用される可能性の低い画像データを優先的に削除することができる。
前記破棄手段により前記処理対象画像データが破棄された場合、前記符号化手段は、前記符号化により生成する前記符号化データの符号量を増やすことができる。
前記符号化手段により前記処理対象画像データが符号化されて生成された前記符号化データに対して冗長符号化を行い、冗長データを生成する冗長符号化手段をさらに備えることができる。
前記送信手段は、前記処理対象画像データが前記基準画像データと類似している場合、前記冗長符号化手段により生成された前記冗長データを送信することができる。
本発明の一側面はまた、画像データを処理する情報処理装置の情報処理方法であって、解析手段は、画像データを低域成分と高域成分に分割する処理を再帰的に繰り返すフィルタ処理において最終分割レベルの係数を1ライン生成するために必要なライン数分の画像データであるプレシンクトを処理単位とし、処理対象のプレシンクトの画像データである処理対象画像データと、記憶手段から取得した、前記処理対象のプレシンクトに対して所定の相対位置に位置するプレシンクトの画像データであり、前記処理対象画像データより以前に処理される基準とする基準画像データとの類似度を求め、前記類似度が所定の閾値に達しているか否かによって、前記処理対象画像データが前記基準画像データと類似しているか否かを求める解析処理を行い、前記記憶手段は、解析された前記処理対象画像データを記憶し、符号化手段は、前記処理対象画像データを符号化し、破棄手段は、解析の結果、前記処理対象画像データが前記基準画像データと類似している場合、前記処理対象画像データを破棄し、送信手段は、解析の結果、前記処理対象画像データが前記基準画像データと類似していない場合、前記処理対象画像データが符号化されて生成された符号化データを送信するステップを含む情報処理方法である。
本発明においては、画像データを低域成分と高域成分に分割する処理を再帰的に繰り返すフィルタ処理において最終分割レベルの係数を1ライン生成するために必要なライン数分の画像データであるプレシンクトが処理単位とされ、処理対象のプレシンクトの画像データである処理対象画像データと、記憶手段から取得した、処理対象のプレシンクトに対して所定の相対位置に位置するプレシンクトの画像データであり、処理対象画像データより以前に処理される基準画像データとの類似度が求められ、その類似度が所定の閾値に達しているか否かによって、処理対象画像データが基準画像データと類似しているか否かが求められ、処理対象画像データが符号化され、解析の結果、処理対象画像データが基準画像データと類似している場合、処理対象画像データが破棄され、解析の結果、処理対象画像データが基準画像データと類似していない場合、処理対象画像データが符号化されて生成された符号化データが送信される。
本発明によれば、データ伝送を行うことができる。特に、画像データ伝送において画質劣化を抑制しながら伝送に必要な帯域幅を低減させることができる。
以下、発明を実施するための最良の形態(以下実施の形態とする)について説明する。なお、説明は以下の順序で行う。
1.第1の実施の形態(ネットワークシステム:送信データを適切に選択して破棄する例)
2.第2の実施の形態(ネットワークシステム:符号量を増加させる例)
3.第3の実施の形態(ネットワークシステム:冗長度を増加させる例)
4.第4の実施の形態(ネットワークシステム:隠蔽用ヘッダを用いる例)
<1.第1の実施の形態>
[ネットワークシステムの構成例]
図1は、本発明を適用したネットワークシステムの構成例を示すブロック図である。図1において、ネットワークシステム100は、撮像装置101、送信装置102、受信装置103、および表示装置104を有する。ネットワークシステム100は、撮像装置101から表示装置104まで動画像データを低遅延で伝送させるシステムである。ネットワークシステム100において、撮像装置101は、被写体を撮像して動画像データを生成し、送信装置102は、撮像装置101において得られた動画像データを送信し、受信装置103は、その動画像データを、ネットワーク110を介して受信し、表示装置104は、受信された動画像データの動画像を再生し、表示する。
つまり、表示装置104には、撮像装置101において撮像された画像が表示される。したがって、撮像装置101が撮像を行って動画像データが生成されてから、表示装置104がそれを取得して再生し、その動画像を表示するまでの時間(遅延時間)がより短い方が望ましい。
そこで、送信装置102および受信装置103は、より低遅延に動画像データを符号化・復号し、パケット化して伝送させる。この伝送時においてパケットロスが発生しても、そのパケットを再送させる時間的余裕が無いので、受信装置103は、既に受信されたデータで代用することにより、データロスを隠蔽する。
送信装置102は、この受信装置103のエラー隠蔽機能を期待して、送信データの一部を破棄する。このとき送信装置102は、破棄による影響の少ないデータを選択して破棄する。受信装置103は、破棄された部分を補間する。
[送信装置・受信装置の主な構成例]
図2は、図1の送信装置102および受信装置103の内部の主な構成例を示すブロック図である。
図2に示されるように、送信装置102は、解析部121、記憶部122、符号化部123、パケタイズ処理部124、および送信部125を有する。
撮像装置101の撮像により得られた動画像データは、送信装置102の解析部121および符号化部123に供給される。動画像データは、生成されたものから順次送信装置102に供給される。つまり、動画像データにおいて、各ピクチャはその時系列順に供給される。各ピクチャ内において、各ラインは画像の上から下に向かう順に供給される。各ラインにおいて、各画素は画像の左から右に向かう順に供給される。
送信装置102の各部は、このように入力される画像データを、複数ラインからなるプレシンクト(ラインブロックまたはスライスとも称する)単位で処理する。プレシンクトについての詳細は後述する。
解析部121は、供給された画像データの、破棄する部分を決定するための判断材料として、その画像データの特徴を解析する。例えば、解析部121は、現在処理対象とする、最も新しく入力されたプレシンクトの画像(以下、現画像と称する)を、基準とする所定の画像(基準画像)と比較し、現画像と基準画像の類似度を求める。基準画像としては、例えば、現画像よりも前に入力され、過去に処理対象としたプレシンクトの画像(以下、前画像と称する)がある。以下においては、この前画像を基準画像として説明する。
解析部121は、現画像に対応する前画像を、記憶部122より読み出して比較を行う。また、解析部121は、現画像の解析が終わると、その現画像を記憶部122に供給し、今後の現画像に対する前画像として記憶させる。
記憶部122は、例えばハードディスクや半導体メモリ等、任意の記憶媒体により構成される記憶領域であり、前画像を記憶する。記憶部122の記憶領域が十分に大きければ、全ての前画像を記憶するようにしてもよい。記憶部122の記憶領域が有限である場合、記憶部122は、解析部121により今後使用される可能性の無い、または、使用される可能性の低い画像を優先的に削除する。
解析部121は、現画像のプレシンクトを基準とした所定の相対位置のプレシンクトの画像を前画像として記憶部122より読み出して使用する。
ある現画像に対する前画像として、例えば、その現画像と同じピクチャの、現画像のプレシンクトに隣接するプレシンクトの画像(つまり、現画像より1つ前のプレシンクトの画像)が考えられる。また、例えば、その現画像のプレシンクトの近傍のプレシンクトの画像(つまり、現画像より数プレシンクト前の画像)が前画像として考えられる。さらに、例えば、その現画像のピクチャより1つ前のピクチャの、現画像と同じ位置のプレシンクトの画像が前画像として考えられる。
もちろん、前画像とする相対位置は任意であり、現画像より前に入力される画像であれば、これら以外のプレシンクトの画像を前画像としても良い。また、前画像は複数存在しても良い。つまり、前画像とする相対位置は複数存在しても良い。いずれにしても、記憶部122に保持された画像は、いずれ前画像として使用されなくなる(使用される可能性が低減する)。記憶部122は、このようなプレシンクトの画像から優先的に削除するようにしてよい。
解析部121は、例えば、求めた類似度を所定の閾値と比較し、その大小関係によって、現画像が前画像に類似しているか否かを決定する。解析部121は、このような解析結果をパケタイズ処理部124に供給する。
符号化部123は、入力された現画像をインターフレーム方式で圧縮符号化する。この符号化方法は、インターフレーム方式であれば任意である。以下においては、符号化部123が、画質劣化の少ないウェーブレット変換とエントロピ符号化を用いる方法で圧縮符号化を行うものとして説明する。なお、低遅延データ伝送を実現するために、符号化部123は、プレシンクトを処理単位として圧縮符号化を行う。
符号化部123は、画像データを圧縮符号化して符号化データを生成し、その符号化データをパケタイズ処理部124に供給する。
パケタイズ処理部124は、解析部121の解析結果に基づいて、供給される符号化データの破棄を行う。例えば、現画像が前画像に類似している場合、パケタイズ処理部124は、その現画像に対応する符号化データを破棄する。また、現画像が前画像に類似していない場合、パケタイズ処理部124は、その現画像に対応する符号化データをパケット化し、得られたパケットについてエラー訂正用の冗長パケット(冗長データ)を生成する。そして、パケタイズ処理部124は、生成した冗長パケットおよび符号化データのパケットを、受信装置103に送信するために送信部125に供給する。
送信部125は、パケタイズ処理部124より供給されるパケットを、ネットワーク110を介して受信装置103に送信する。
以上のように、送信装置101は、過去に処理した画像と類似する画像の符号化データを破棄することにより、受信装置103に送信するデータを間引き、その伝送データのデータ量を低減させる。
受信装置103は、以上のように送信装置102より送信されたパケットを受信する。受信装置103は、パケットを損失(ロス)したプレシンクトを、前画像の符号化データで補完することにより、パケット損失を隠蔽する機能を有する。図2に示されるように、受信装置103は、受信部131、デパケタイズ処理部132、ロス解析部133、記憶部134、および復号部135を有する。なお、受信装置103の各部もプレシンクトを処理単位とする。
受信部131は、ネットワーク110を介して送信されるパケットを受信し、それをデパケタイズ処理部132に供給する。
デパケタイズ処理部132は、供給されたパケットをデパケタイズし、符号化データを抽出し、抽出した符号化データをロス解析部133に供給する。ただし、処理対象のプレシンクトのパケットが全て揃っていない場合、デパケタイズ処理部132は、損失したパケットを復元可能であれば、冗長データを用いて損失したパケットの復元を行う。そして、デパケタイズ処理部132は、受信されたパケットと復元されたパケットをデパケタイズし、符号化データを抽出し、抽出した符号化データをロス解析部133に供給する。
損失したパケット数(符号化データの損失量)が多く復元不可能であれば、デパケタイズ処理部132は、パケットの復元を省略する。デパケタイズ処理部132は、受信されたパケットだけデパケタイズし、符号化データを抽出し、抽出した符号化データをロス解析部133に供給する。つまり、この場合、デパケタイズ処理部132は、一部または全部が欠損した符号化データをロス解析部133に供給する。なお、復元不可能なパケットロスが発生した場合、特に、全ての符号化データを損失した場合、デパケタイズ処理部132は、ロス解析部133にその旨を通知するだけでもよい。
ロス解析部133は、処理対象のプレシンクトの符号化データが全て供給された場合、その符号化データを復号部135に供給する。
また、処理対象のプレシンクトの符号化データが揃わない場合、ロス解析部133は、処理対象のプレシンクトの画像である現画像に対応する前画像の、損失の無い符号化データを記憶部134より読み出し、現画像の不十分な符号化データに置き換えて復号部135に供給する。つまり、ロス解析部133は、前画像のデータを用いてデータ補完を行う。
また、ロス解析部133は、データ補完しなかった場合、デパケタイズ処理部132より供給された、損失の無い符号化データを記憶部134に供給し、記憶させる。
記憶部134は、例えばハードディスクや半導体メモリ等、任意の記憶媒体により構成される記憶領域であり、前画像の符号化データを記憶する。記憶部134の記憶領域が十分に大きければ、全ての前画像の符号化データを記憶するようにしてもよい。記憶部134の記憶領域が有限である場合、記憶部134は、ロス解析部133により今後使用される可能性の無い、または、使用される可能性の低い符号化データを優先的に削除する。
ロス解析部133は、デパケタイズ処理部より供給された符号化データの画像である現画像のプレシンクトを基準とした所定の相対位置のプレシンクトの画像を前画像とし、その前画像の符号化データを記憶部122より読み出し、データ補完に使用する。
復号部135は、ロス解析部133より供給される符号化データを、符号化部123に対応する方法で復号し、画像データを生成する。復号部135は、生成した画像データを表示装置104に供給する。
[送信装置の詳細な構成例]
次に、送信装置102について説明する。図3は、送信装置102の内部の詳細な構成例を示すブロック図である。
図3に示されるように、解析部121は、取得部151、比較部152、判定部153、記憶制御部154、および制御部155を備える。
取得部151は、撮像装置101より供給される現画像の画像データを取得する。また、取得部151は、記憶部122より、現画像に対応する前画像の画像データを取得する。取得部151は、それらの画像データを比較部152に供給する。
比較部152は、取得部151より供給された現画像の動画像データ、および、前画像の画像データを比較する。例えば、比較部152は、現画像と前画像の互いに同じ位置の画素同士で画素値を比べ、その差分値として例えばPSNR(Peak Signal-to-Noise Ratio)を算出する。そして、比較部152は、その差分値を、現画像および前画像の画像データとともに、判定部153に供給する。
判定部153は、それらのデータを取得すると、差分値を予め用意された所定の閾値と比較し、その大小によって現画像と前画像が類似しているか否かを判定する。判定部153は、その判定結果を制御部155に供給する。
制御部155は、その判定結果を、パケタイズ処理部124の破棄部171に供給する(C101)。
また、判定部153は、現画像の画像データを記憶制御部154に供給する。記憶制御部154は、判定部153より供給されたデータを記憶部122に供給し、記憶させる。記憶部122に記憶された画像データは、その後の現画像に対する前画像として適宜使用される。
符号化部123は、ウェーブレット変換部161、量子化部162、エントロピ符号化部163、およびレート制御部164を有する。
ウェーブレット変換部161は、処理対象のプレシンクト(現画像)の画像データをウェーブレット変換する。詳細については後述するが、ウェーブレット変換は、入力データを低域成分と高域成分に分割する分析フィルタ処理を画面水平方向および画面垂直方向の両方に対して行う処理である。つまり、ウェーブレット変換処理により入力データは、水平方向および垂直方向に低域な成分(LL成分)、水平方向に高域で垂直方向に低域な成分(HL成分)、水平方向に低域で垂直方向に高域な成分(LH成分)、および、水平方向および垂直方向に高域な成分(HH成分)の4つの成分(サブバンド)に分割される。
ウェーブレット変換部161は、このようなウェーブレット変換処理を、所定回数、分析フィルタ処理により得られる水平方向および垂直方向に低域な成分(LL成分)に対して再帰的に繰り返す。つまり、現画像の画像データは、階層化された複数のサブバンド(周波数成分)毎のウェーブレット係数(以下、係数と称する)に分割される。ウェーブレット変換部161は、生成した係数を量子化部162に供給する。
量子化部162は、ウェーブレット変換部161により生成される各成分の係数を、例えば量子化ステップサイズで除算することにより量子化し、量子化係数を生成する。この際、量子化部162は、プレシンクト毎に量子化ステップサイズを設定することができる。このプレシンクトは、ある画像領域のすべての周波数成分の係数を包含しているため、プレシンクト毎に量子化を行えば、ウェーブレット変換の特徴である多重解像度分析の利点を活かすことができる。また、全画面でプレシンクト数だけを決めればよいため、量子化の負荷も小さくて済む。
さらに、画像信号のエネルギは一般的に低域成分に集中しており、また、人間の視覚上、低域成分の劣化が目立ちやすいという特性があるため、量子化に際しては、低域成分のサブバンドでの量子化ステップサイズが結果的に小さな値になるように、重み付けを行うことが有効である。この重み付けにより、低域成分には相対的に多くの情報量が割り当てられるようになり、全体の主観的な画質が向上する。
エントロピ符号化部163は、量子化部162で生成された量子化係数を情報源符号化し、圧縮された符号化コードストリームを生成する。情報源符号化としては、例えばハフマン符号化や、JPEG2000方式で用いられているさらに高精度な算術符号化を用いることができる。
ここで、エントロピ符号化をどの範囲の係数に対して行うかは、圧縮効率に直接関係する非常に重要な要素になる。例えば、JPEG方式では、8×8のブロックに対してDCT変換を施し、生成された64個のDCT変換係数に対してハフマン符号化を行うことで、情報を圧縮している。すなわち、64個のDCT変換係数がエントロピ符号化の範囲になる。
ウェーブレット変換部161では、8×8ブロックに対するDCT変換とは異なり、ライン単位でウェーブレット変換を施しているため、エントロピ符号化部163では、周波数帯域(サブバンド)毎に独立に、且つ各周波数帯域内をプレシンクト毎に情報源符号化する。エントロピ符号化部163は、生成した符号化データをレート制御部164に供給する。
レート制御部164は、最終的に目標のビットレート又は圧縮率に合わせるための制御を行い、レート制御後の符号化データをパケタイズ処理部124の破棄部171に出力する。例えば、このレート制御部164は、ビットレートを上げる場合には量子化ステップサイズを小さくし、ビットレートを下げる場合には量子化ステップサイズを大きくするように、量子化部162に対して制御信号を送信する。
パケタイズ処理部124は、破棄部171、パケット化部172、および冗長符号化部173を有する。破棄部171は、制御部155より供給される比較判定結果を参照し、現画像と前画像が類似する現画像の符号化データを破棄し、それ以外の符号化データをパケット化部172に供給する。
パケット化部172は、破棄部171より供給される符号化データを分割してパケット化し、それを冗長符号化部173に供給する。冗長符号化部173は、パケット化部172より供給される符号化データに対して冗長符号化を行い、冗長パケット(冗長データ)を生成し、符号化データのパケットとともに、送信部125に供給し、送信させる。なお、この冗長符号化処理は省略可能である。つまり冗長符号化部173を省略し、パケット化部172においてパケット化された符号化データをそのまま送信部125に供給し、送信させるようにしてもよい。
[ウェーブレット変換の説明]
次に、図3のウェーブレット変換部161が行うウェーブレット変換について説明する。
上述したように、ウェーブレット変換は、入力データを低域成分と高域成分に分割する分析フィルタ処理を画面水平方向および画面垂直方向の両方に対して行う処理である。つまり、ウェーブレット変換処理により入力データは、水平方向および垂直方向に低域な成分(LL成分)、水平方向に高域で垂直方向に低域な成分(HL成分)、水平方向に低域で垂直方向に高域な成分(LH成分)、および、水平方向および垂直方向に高域な成分(HH成分)の4つの成分(サブバンド)に分割される。
ウェーブレット変換部161は、このようなウェーブレット変換処理を、所定回数、分析フィルタ処理により得られる水平方向および垂直方向に低域な成分(LL成分)に対して再帰的に繰り返す。つまり、ウェーブレット変換処理により、動画像データの各ピクチャは、階層化された複数のサブバンド(周波数成分)毎の係数に分割される。
ウェーブレット変換部161は、ライン毎に画像左から右に向かう順に1サンプル(1コラム)ずつ入力されるピクチャ毎の画像データに対して、必要なサンプル数のデータを入手次第、画像水平方向に分析フィルタリングを行う。つまり、ウェーブレット変換部161は、分析フィルタリングを実行可能なサンプル数のデータを入手する毎に、水平分析フィルタリングを実行する。例えば、ウェーブレット変換部161は、図4の左に示されるベースバンドの画像データ201に対して、Mコラム入力される毎に水平分析フィルタリングを行い、1ラインずつ水平方向に低域な成分(L)と高域な成分(H)に分割する。図4の右に示される水平分析フィルタ処理結果202の斜線部分は、ウェーブレット変換部161により水平方向に低域な成分(L)と高域な成分(H)に分割されたNライン分の係数を示す。
このように所定のライン数(Nライン)分の水平分析フィルタ処理結果202が生成されると、ウェーブレット変換部161は、次に、垂直方向に分析フィルタリング(垂直分析フィルタリング)を行う。なお、ここで、Nは、ウェーブレット変換部161が垂直分析フィルタリングを実行するのに必要なライン数以上の自然数とする。
ウェーブレット変換部161は、生成された、そのNライン分の水平分析フィルタ処理結果202の各成分に対して、コラム毎に垂直分析フィルタリングを行う。垂直分析フィルタリングがNライン毎に繰り返されると、水平分析フィルタ処理結果202の各成分の係数は、図5の左に示されるように、垂直方向に低域な成分の係数と水平方向に高域な成分の係数に、それぞれ分割される。
つまり、水平方向に低域な成分(L)は、水平方向および垂直方向の両方に低域な成分(LL成分)と、水平方向に低域で垂直方向に高域な成分(LH成分)に分割される。また、水平方向に高域な成分は、水平方向に高域で垂直方向に低域な成分(HL成分)と、水平方向および垂直方向の両方に高域な成分(HH成分)に分割される。すなわち、水平分析フィルタ処理結果202は、4つの成分の係数に分割される(係数203)。
ウェーブレット変換部161は、以上のような水平分析フィルタリングおよび垂直分析フィルタリングを、LL成分の係数に対して再帰的に繰り返す。つまり、所定の階層(分割レベル)の係数が得られるまで、得られた分析フィルタリングの結果のうち、HL成分、LH成分、HH成分は処理結果として外部に出力される。残りのLL成分は、ウェーブレット変換部161により、再度分析フィルタリングされる。
例えば、図4の左に示される係数203は、図4の右に示される係数204に変換される。係数204では、LL成分が再度分析フィルタリングされ、LLLL成分、LLHL成分、LLLH成分、およびLLHH成分の4つの成分に分割されている。分割レベルが、予め定められた所定の階層に達していない場合、ウェーブレット変換部161は、新たに生成されたLLLL成分に対して再度分析フィルタリングを行う。
ウェーブレット変換部161は、このような分析フィルタリングを所定回数再帰的に行い、動画像データを、所望の分割レベルまで分割する。図6は、分割レベル3(3階層)まで分割した場合の係数の例を示す図である。図6において、分割レベル3まで分割された係数205は、3階層に階層化された10個のサブバンドに分割される。
図6において、1HL成分、1LH成分、および1HH成分の3つのサブバンドは、ベースバンドの画像データが分割された分割レベル1のサブバンドである。また、2HL成分、2LH成分、および2HH成分は、分割レベル1の1LL成分が分割された分割レベル2のサブバンドである。さらに、3LL成分、3HL成分、3LH成分、および3HH成分は、分割レベル2の2LL成分が分割された分割レベル3のサブバンドである。
ウェーブレット変換処理では、フィルタリング処理を繰り返す毎に(階層が1つ下位になる毎に)、生成されるライン数は2のべき乗分の1の大きさで小さくなっていく。例えば、図4および図5の例のように、Nラインのベースバンドの画像データは、分析フィルタリングされ、N/2ずつの4つの成分の係数に分割される(図5左の係数203)。そのLL成分は、再度分析フィルタリングされると、図5右の係数204のように、N/4ずつの4つの成分の係数に分割される。
このように、係数のライン数は、分析フィルタリングされる毎に、2のべき乗分の1ずつ少なくなっていく。換言するに、最終分割レベルの係数を1ライン生成するために必要なベースバンドのライン数は、そのフィルタリング処理を何回繰り返すか(最終分割レベルの階層数)によって決まる。通常、この階層数は予め定められているので、最終分割レベルの係数を1ライン生成するために必要なベースバンドのライン数も予め定まる。例えば、図6に示される例のように最終分割レベルが3の場合、最終分割レベルの係数を1ライン生成するためにベースバンドの画像データは8ライン必要である。
このような、最終分割レベルの係数を1ライン生成するために必要なベースバンドの画像データ(複数ライン分の画像データ)、または、各階層の係数をまとめてプレシンクト(またはラインブロック)と称する。
図6において斜線で示される部分が1プレシンクトを構成する係数である。図6の例の場合、プレシンクトは、分割レベル3の各成分の1ライン分の係数、分割レベル2の各成分の2ライン分の係数、並びに、分割レベル3の各成分の4ライン分の係数により構成される。なお、これらに相当する分析フィルタリング前の画像データ、すなわち、この例では8ライン分の画像データのこともプレシンクト(またはラインブロック)と称する。
なお、この分析フィルタリングの演算方法は、任意であり、フィルタのタップ係数に、実際の入力データを畳み込み乗算する畳み込み演算を用いて行うようにしてもよい。ただし、タップ長が長いとその分、計算負荷が増えてしまう恐れがある。そこでこの畳み込み演算の代わりに、演算の負荷を軽減させるために、例えば9×7分析フィルタ等を用いてリフティング演算を行うようにしてもよい。
以上のように複数のサブバンドに分割された係数は、エントロピ符号化部163においてサブバンド毎(所定ライン数毎に)に符号化される。
[復号部の構成例]
以上のように符号化された符号化データは、受信装置103の復号部135において復号される。図7は、その復号部135の内部の主な構成例を示すブロック図である。
図7に示されるように、復号部135は、エントロピ復号部221、逆量子化部222、およびウェーブレット逆変換部223を有する。
エントロピ復号部221は、入力した符号化データを情報源復号し、量子化係数データを生成する。情報源復号としては、エントロピ符号化部163の情報源符号化に対応して、ハフマン復号や、高効率な算術復号などを用いることができる。なお、エントロピ符号化部163においてPラインごとに情報源符号化されている場合、エントロピ復号部221においても同様に、各サブバンドが独立に、かつ各サブバンド内がPライン毎に情報源復号される。
逆量子化部222は、量子化係数データに量子化ステップサイズを乗算することにより逆量子化し、係数データを生成する。この量子化ステップサイズは、通常、符号化コードストリームのヘッダなどに記述されている。なお、量子化部162において、ラインブロック毎に量子化ステップサイズが設定されている場合には、逆量子化部222においても同様に、ラインブロック毎に逆量子化ステップサイズが設定されて、逆量子化される。
ウェーブレット逆変換部223は、ウェーブレット変換部161の逆処理を行う。つまり、ウェーブレット逆変換部223は、ウェーブレット変換部161により複数の周波数帯域に分割された係数データに対して、低域成分と高域成分を合成するフィルタ処理(合成フィルタ処理)を水平方向と垂直方向の両方に対して行う。
上述したリフティング技術を適用したときの分析フィルタリングに対応して、効率的にフィルタリングを実行することができることから、ウェーブレット逆変換の合成フィルタリングにおいても、同様にリフティング技術を用いることが好ましい。
[画像補完の説明]
図2を参照して説明したように、伝送時に符号化データに損失が発生し、復元不可能である場合、ロス解析部133は、その不十分な符号化データの代わりに、前画像の符号化データを復号部135に復号させる。つまり、ロス解析部133は、符号化データに欠損が有る場合、前画像の符号化データで補完する。
この補完処理は、どのような方法であっても良い。以下においては説明を簡略化するために、ロス解析部133が、復号処理の処理単位であるプレシンクト単位でデータ補完を行うものとする。つまり、デパケタイズ処理部132より取得した、処理対象プレシンクトの符号化データに一部でも欠損がある場合、ロス解析部133は、そのプレシンクトの全ての符号化データを破棄し、前画像の(1プレシンクト分の)符号化データを記憶部134より読み出して復号部135に供給する。
この前画像とするプレシンクトの位置は任意である。例えば現画像のプレシンクトと類似性の高い空間的位置関係にあるプレシンクトを前画像としてもよい。例えば、現画像と同じピクチャの、現画像のプレシンクトに隣接するプレシンクト、または、現画像のプレシンクトの近傍のプレシンクトを、前画像としてもよい。
より具体的には、例えば、現画像と同じピクチャの、現画像のプレシンクトの1つ上のプレシンクトの画像を前画像としてもよい。また、例えば、現画像と同じピクチャの、現画像のプレシンクトから2,3プレシンクト上に位置するプレシンクトの画像を前画像としてもよい。
図8は、複数ピクチャのプレシンクトの様子の例を示す図である。図8において、ピクチャ251乃至ピクチャ253は、時間軸上において互いに連続するピクチャであり、ピクチャ251、ピクチャ252、ピクチャ253の順に並ぶ。また、各ピクチャは、3つのプレシンクト(ラインブロックまたはスライス)に分割される。なお、実際には、1ピクチャ当たりのプレシンクト数は任意である。
この場合、例えば、プレシンクト253−3が処理対象プレシンクトであり、その画像が現画像であるとすると、プレシンクト253−2やプレシンクト253−1が前画像として設定される。
また、例えば現画像のプレシンクトと類似性の高い時間的位置関係にあるプレシンクトの画像を前画像としてもよい。例えば、現画像より1つ前のピクチャの、現画像のプレシンクトと同じ位置のプレシンクト、または、現画像より複数ピクチャ前のピクチャの、現画像のプレシンクトと同じ位置のプレシンクトの画像を、前画像としてもよい。
つまり、図8の例の場合、現画像のプレシンクト253−3に対して、ピクチャ252のプレシンクト252−3や、ピクチャ251のプレシンクト251−3画像が前画像として設定される。
もちろん、前画像とするプレシンクトの、現画像のプレシンクトに対する相対位置は任意であり、上述した以外のプレシンクトであっても良い。1つの現画像に対して前画像が複数設定され、その複数の前画像の中から1つが適宜選択されるようにしてもよい。
なお、受信装置103における前画像の相対位置は、送信装置101とは独立して設定される。つまり、ロス解析部133がデータ補完に使用する前画像は、解析部121が比較に用いた前画像と一致しなくてもよい。
[処理の流れの説明]
次に、各処理部により実行される処理の流れの例について説明する。最初に、送信装置101により実行される送信処理の流れの例について、図9のフローチャートを参照して説明する。
送信装置101に画像データが入力され、送信処理が開始されると、解析部121は、ステップS101において、入力された画像データの画像を解析する解析処理を行う。解析処理の詳細については後述する。解析処理が終了すると、符号化部123は、ステップS102において、現画像のデータを符号化し符号化データを生成する。
ステップS103において、パケタイズ処理部124は、ステップS101において実行される解析処理の結果に基づいて、現画像と前画像が類似しているか否かを判定する。類似していない場合、処理は、ステップS104に進む。ステップS104において、パケタイズ処理部124は、現画像の符号化データをパケット化する。このとき、生成したパケットを、例えばリードソロモン(RS(Reed-Solomon))符号等の誤り訂正符号を用いて冗長符号化し、冗長データ(冗長パケット)を生成しても良い。
ステップS105において、送信部125は、パケタイズ処理部124により生成されたパケットを、ネットワーク110を介して受信装置103に送信する。パケットが送信されると送信処理が終了する。
なお、ステップS103において、現画像と前画像が類似していないと判定された場合、処理はステップS106に進む。ステップS106において、パケタイズ処理部124は、処理対象の(現画像の)符号化データを破棄する。符号化データが破棄されると、送信処理が終了する。
なお、送信装置102は、以上のような送信処理を、画像データが1プレシンクト分入力される度に繰り返し実行する。
以上のように、送信装置102は、現画像を解析し、前画像に類似する現画像の符号化データを破棄し、前画像に類似していない現画像の符号化データのみを受信装置103に送信する。
次に、図9のステップS101において実行される解析処理の流れの例を図10のフローチャートを参照して説明する。
解析処理が開始されると、解析部121の取得部151は、ステップS121において、撮像装置101より供給される現画像に対応する前画像を、記憶部122より取得する。ステップS122において、比較部152は、現画像と前画像を比較する。ステップS123において、判定部153は、ステップS122における比較の結果である、現画像と前画像の差分情報を所定の閾値と比較することにより類似度を判定する。
制御部155は、ステップS124において、ステップS123の処理により算出された判定結果をパケタイズ処理部124の破棄部171に通知する。ステップS125において、記憶制御部154は、現画像のデータを、前画像のデータとして記憶部122に記憶させる。ステップS125の処理が終了されると、解析処理が終了し、処理は、図9のステップS101に戻り、ステップS102以降の処理が実行される。
送信装置102は、以上のような解析処理により、破棄するデータを選択する。次に、このように送信された、一部のデータが損失した符号化データを受信する受信装置103による受信処理の流れの例を、図11のフローチャートを参照して説明する。
受信処理が開始されると、受信装置103の受信部131は、ステップS141において、パケットの受信を行う。ステップS142において、デパケタイズ処理部132は、受信されたパケットに対してデパケタイズ処理を行い、復元可能なパケットを復元し、符号化データを抽出する。
ステップS143において、ロス解析部133は、データの損失(ロス)があったか否かを判定する。ロスがあったと判定された場合、処理はステップS144に進む。ステップS144において、ロス解析部133は、そのロスした現画像の符号化データを、前画像で置き換え可能であるか否かを判定する。
置き換え可能であると判定した場合、処理は、ステップS145に進む。ステップS145において、ロス解析部133は、記憶部134より前画像の符号化データを読み出し置き換える。ステップS146において、復号部135は、符号化データを復号し、画像データを生成する。ステップS146の処理が終了すると受信処理が終了される。
また、ステップS144において、前画像で置き換え不可能であると判定された場合、処理は、ステップS146に進み、それ以降の処理が実行される。さらに、ステップS143において、ロスが無かったと判定された場合、処理はステップS147に進む。
ステップS147において、ロス解析部133は、損失の無いプレシンクト単位の符号化データを、記憶部134に供給し、記憶させる。ステップS147の処理が終了すると、処理は、ステップS146に戻り、それ以降の処理が実行される。
以上のように、受信装置103は、復元不可能なパケットの損失に対して、前画像の符号化データを置き換えることによりデータ補完を行う。
低遅延でデータ転送を行う場合、ラインベースで動作するコーデックは有利であるが、低遅延を目的としているが故にデータの再送をする時間が確保できない。しかしながら、実際問題として、伝送時のデータ損失は十分に起こりうる事態であり、このデータの欠損により復元画像の画質が大きく劣化してしまう。
そこで、一般的には、このような低遅延のデータ伝送を行う受信装置103には、復号画像の画質向上のために、損失したデータを、冗長データを用いて復元したり、以前に伝送されたデータで代用したりする機能が不可欠になる。
ところで、このような低遅延のデータ伝送を目的としたコーデック方法は、圧縮率を上げることが困難であり、画像データの伝送に通信回線の容量を最大限使用する場合が多い。つまり通信帯域に余裕が無い場合が多い。したがって、画像データ送信中に、例えば冗長データ等のその他のデータを送信することは困難である。つまり、画像データの冗長度を上げることは困難であり、十分な復元性能を得られないことも多い。
したがって、受信装置103においては、冗長符号化を用いたエラー訂正よりも、以前に伝送されたデータで代用するエラー隠蔽機能が重要であり、不可欠である。つまり、低遅延データ伝送用の受信装置103においては、一般的に、このようなエラー隠蔽機能が搭載されている。
送信装置102は、この受信装置103のエラー隠蔽機能をより有効活用することにより、データ伝送に必要な帯域幅を低減させる。つまり、上述したように、送信装置102は、送信データの一部(一部のプレシンクトの符号化データ)を破棄する。受信装置103は、その破棄されたプレシンクトの符号化データを、伝送時に損失したデータと同様に、以前に伝送されたデータで代用し、エラー隠蔽を行う。
したがって、送信装置102は、画像データ伝送において復号画像の画質劣化を抑制しながら伝送に必要な帯域幅を低減させることができる。
ここで、1つの特徴として、送信装置102によるデータ破棄のアルゴリズムは、受信装置103によるエラー隠蔽のアルゴリズムと対応していなくてもよい。つまり、解析部121の解析処理のアルゴリズムは任意である。また、ロス解析部133によるデータ補完のアルゴリズムも任意である。したがって、受信装置103は、データ補完を、送信装置102と連携して行うのではなく、受信装置103単体で独自に行う。
換言すれば、受信側に特別な機能を追加する必要がなく、また、受信側のアルゴリズムにも依存しないので、送信装置102は、高い汎用性を有する。つまり、受信装置103は、単独でエラー隠蔽(データ補完)を行うことができればよい。
また、送信装置102は、上述したように、符号化データの一部を破棄するのみである。したがって、符号化部123に汎用的なエンコーダを用いることができ、新たに特殊なエンコーダを開発する必要がない。従って、送信装置102は、容易かつ安価に実現することができる。
また、他の特徴として、上述したように、送信装置102は、解析処理を行い現画像と前画像とを比較するので、その類似度が高いデータを選択して破棄することができる。受信装置103において損失した画像を他の画像で補完する場合、画質向上の目的からすると、理論的に、損失した画像とより類似する画像を用いるのが望ましい。つまり、どのようなアルゴリズムを採用するにしても、受信装置103は、損失した画像とより類似する画像を用いてデータ補完を行うようにするのが一般的である。
したがって、送信装置102は、破棄するデータをこのように選択することにより、受信装置103が補完しやすいデータを破棄することができる。つまり、送信装置102は、例えば、破棄するデータをランダムに選択したり、画像の所定の位置のデータを無条件に破棄したりするよりも、復号画像の画質劣化をより低減させることができる。
もちろん、破棄するデータの選択方法は、これ以外であってもよい。例えば、解析部121が現画像の画像データを解析し、その画像データについて任意の特徴を求めるようにしてもよい。そして、その特徴が所定の基準を満たす場合、つまり、現画像の画像データが所定の特徴を有する場合、破棄部171が、現画像の符号化データを破棄し、現画像がその特徴を有さない場合、送信部125がその符号化データを送信するようにしてもよい。
また、以上においては基準画像(の画像データ)として前画像(の画像データ)を用いるように説明したが、基準画像(の画像データ)は現画像(の画像データ)以外の画像(の画像データ)ならどのような画像(の画像データ)であっても良い。
なお、上述したように、送信装置102と受信装置103は、互いに独立に処理を行うため、受信装置103が全てのデータを補完することが保証されない。しかしながら、仮に受信装置103がデータを補完できなくても、そのピクチャのそのプレシンクトの画像が復号されないだけであり、復号処理全体が破綻することはない。したがって、このような事態が頻発しない限り、復号画像に与える影響はそれほど大きくはない。
もちろん、送信装置102と受信装置103が連携して動作するようにしてもよい。送信装置102において破棄するデータを選択するアルゴリズムと、受信装置103において損失したデータを補完するアルゴリズムが対応している方が、送信装置102におけるデータ破棄の影響をより正確に除去することができ、復号画像の画質向上に寄与することができる。ただし、その場合、送信装置102の汎用性が低くなる恐れがある。また、その連携のために、送信装置102や受信装置103の処理の負荷が増大する恐れもある。さらに、その連携のために、通信帯域の確保が必要になる恐れもある。
以上に説明した、送信装置102や受信装置103の各種処理の処理単位(例えば、符号化単位等)はいずれも任意であり、例えばピクチャ単位等、上述した以外の処理単位であってもよい。ただし、この処理単位は、遅延時間と関連するので、処理単位が大きくなると低遅延のデータ伝送が実現困難になる恐れもある。
図1において説明した各装置の構成は、上述した以外であってもよい。
例えば、図1においては、撮像装置101において撮像されて生成された撮像画像の画像データが、送信装置102に入力されるように説明したが、受信装置103に伝送する画像データは、どのような画像データであってもよい。例えば、送信装置102が記録媒体より画像データを読み出すようにしてもよい。すなわち、撮像装置101は省略可能である。
また、受信装置103より出力される画像データは、どのように処理されても良く、例えば記録媒体に記録されるようにしてもよい。つまり、表示装置104も省略可能である。
さらに、各装置は、上述した以外の構成を有するようにしてもよい。また、各装置が複数設けられるようにしてもよい。例えば、1台の送信装置102に対して複数の受信装置103が接続されるようにし、送信装置102より複数の受信装置103に対して画像データがでんそうされるようにしてもよい。その際、各受信装置103が有するエラー隠蔽機能のアルゴリズムが互いに異なるようにすることもできる。
<2.第2の実施の形態>
[処理の流れの説明]
以上においては、送信装置102が伝送データを間引くことにより通信帯域を節約することを説明したが、その帯域を節約した分、符号化データの符号量を増やすようにしてもよい。
この場合、図3において制御部155は、破棄部171に判定結果を供給した後(C101)、さらに、ビットレートを上げるように(量子化ステップサイズを小さくするように)、量子化部162に対して制御信号C102を送信する。量子化部162は、この制御に基づいて量子化ステップサイズを調整することにより、符号化データの符号量を増やす。
図12は、その場合の送信処理の流れの例を説明するフローチャートである。
この場合も、ステップS161乃至ステップS166の各処理は、図9のステップS101乃至ステップS106の各処理と同様に実行される。ただし、ステップS166において符号化データが破棄されると、処理はステップS167に進む。ステップS167において、量子化部162は、制御部155の制御に基づいて量子化ステップサイズを小さくし、符号化データの符号量を増やす(ビットレートを上げる)。ステップS167の処理を終了すると、送信処理は終了する。
このように、送信装置102は、データを破棄することにより、データ送信に使用する帯域を節約した分、送信する符号化データのビットレートを上げる。つまり、受信装置102が受信する符号化データのビットレートが上がる。送信装置102が破棄した符号化データは、理論上、送信済みの符号化データで補完されるので、結局復号される符号化データのビットレートが上がることになる。つまり、送信装置102は、復号画像の画質劣化をより低減させることができる。
なお、このとき、解析部121による解析処理と符号化部123による符号化処理を並行して実行するために、制御部155は、現在処理対象のプレシンクトの符号化データではなく、次以降のプレシンクトの符号化データのビットレートを制御する。もちろん、現在処理対象のプレシンクトの符号化データのビットレートを制御することも可能であるが、その場合、符号化処理を解析処理の後に行わなければならないので遅延時間が増大する恐れがある。
<3.第3の実施の形態>
[処理の流れの説明]
また、破棄する符号化データの代わりに、他のデータを送信させるようにしてもよい。例えば、節約した通信帯域を利用して、符号化データの冗長データを送信するようにしてもよい。
この場合、図3において、冗長符号化部173は、符号化データに対して冗長符号化を行い、冗長データを生成するが、生成した冗長データを送信せずに保持する。若しくは、冗長符号化部173は、生成した冗長データを符号化データとともに送信させるが、符号化データの送信を優先させ、ネットワーク110の帯域制限等により、送信できなかった冗長データを保持する。
これに対して、制御部155は、破棄部171に判定結果を供給し(C101)、符号化データを破棄させた後、さらに、その破棄させた符号化データの代わりに、保持している冗長データを送信させるように、冗長符号化部173に対して制御信号C103を送信する。冗長符号化部173は、この制御に基づいて、保持している冗長データを送信する。
図13は、その場合の送信処理の流れの例を説明するフローチャートである。
この場合も、ステップS181乃至ステップS184の各処理は、図9のステップS101乃至ステップS104の各処理と基本的に同様に実行される。ただし、ステップS184において符号化データがパケット化されてパケットが生成されると、処理はステップS185に進む。
ステップS185において、冗長符号化部173は、生成したパケットを、例えばリードソロモン(RS(Reed-Solomon))符号等の誤り訂正符号を用いて冗長符号化し、冗長データ(冗長パケット)を生成する。冗長符号化が行われると、送信部135は、ステップS186において、生成されたパケットを、ネットワーク110を介して受信装置103に送信する。このとき、送信部135は、符号化データのパケットを優先的に送信させるか、若しくは、符号化データのパケットのみ送信させる。上述したように、送信されなかった冗長データのパケットは、冗長符号化部173において保持される。
ステップS186の処理が終了すると、送信処理が終了される。
また、ステップS183において、現画像が前画像と類似していると判定された場合、処理はステップS187に進む。ステップS187において、破棄部171は、画像が類似するとされた現画像の符号化データを破棄する。ステップS188において、送信部125は、破棄された符号化データのパケットの代わりに、冗長符号化部173により保持されている未送信の冗長パケットを送信する。
ステップS188の処理が終了すると、送信処理が終了される。
このように、送信装置102は、データを破棄することにより、データ送信に使用する帯域を節約した分を利用して冗長データを送信する。このようにすることにより、帯域を節約しない場合よりも冗長データを多く送信することができるので、送信装置102は、符号化データの冗長度を向上させることができる。つまり、送信装置102は、伝送する符号化データの復元性能を向上させ、復号画像の画質劣化をより低減させることができる。
なお、破棄する符号化データの量に応じて冗長度、つまり、冗長符号化部173が生成する冗長データのデータ量を調整することができるようにしてもよい。
<4.第4の実施の形態>
[送信装置・受信装置の主な構成例]
破棄する符号化データの代わりに送信する他のデータは、冗長データ以外のどのようなデータであってもよい。例えば、受信装置103におけるエラー隠蔽処理を制御する情報を送信するようにしてもよい。
例えば、受信装置103が現画像に置き換える前画像を複数のプレシンクトの中から選択することができ、その受信装置103がその選択において適切な画像を選択することができるように、送信装置102から、置き換え可能か否かを示す情報がヘッダ情報(隠蔽用ヘッダ)として供給されるようなシステムが考えられる。
このようなシステムにおいても、送信装置102が符号化データを破棄すると、受信装置103においてその符号化データについての置き換えが行われる。このとき、上述したような送信装置102より供給される隠蔽用ヘッダの情報を利用することにより、受信装置103は、より適切なプレシンクトを前画像として選択することができる。つまり、受信装置103は、より適切な符号化データで置き換えを行うことができる。すなわち、送信装置102は、破棄したデータの代わりにこのような隠蔽用ヘッダを送信することにより、復号画像の画質劣化をより低減させることができる。
換言するに、本発明は、送信装置102と受信装置103との間で制御情報の授受を行うような、一般的でないシステムにも容易に適用することができる。
図14は、その場合の送信装置102および受信装置103の構成例を示すブロック図である。
図14に示されるように、送信装置102は、図2を参照して説明した構成の他に、隠蔽用ヘッダ生成部301を有する。
この場合、解析部121は、入力される画像データに対して、エラー隠蔽のための解析を行う。なお、エラー隠蔽とは、データ伝送時に発生する伝送誤りを隠蔽することである。解析部121は、入力された画像データと、記憶部122より読み出した1つ前のピクチャの画像データとを比較する。つまり、解析部121は、連続する2つのピクチャ(フレームまたはフィールド)間で、互いに同じ位置のプレシンクトの画像を比較する。解析部121は、その比較結果を解析結果として隠蔽用ヘッダ生成部123に供給する。
隠蔽用ヘッダ生成部301は、その解析結果に基づいて、プレシンクトのエラーの隠蔽方法を示す隠蔽情報である隠蔽用ヘッダを生成する。より具体的に説明すると、隠蔽用ヘッダ生成部301は、受信装置103によるエラー隠蔽処理の際に、エラーが発生したプレシンクトに置き換え可能なプレシンクトを示す情報(どのピクチャのどのプレシンクトのデータなら置き換え可能かを示す情報)を含むヘッダ情報(隠蔽用ヘッダ)を生成し、それをパケタイズ処理部124に供給する。
パケタイズ処理部124は、符号化部121より供給される符号化データと隠蔽用ヘッダ生成部301より供給される隠蔽用ヘッダから伝送用のパケットを作成する(パケット化する)つまり、パケタイズ処理部124は、符号化データに隠蔽用ヘッダを付加(多重化)してパケット化する。このように生成されたパケットは、送信部125により受信装置103に送信される。
なお、解析部121は、例えば図1乃至図13を参照して上述した各場合と同様に、前画像と現画像の類似度判定を行い、その判定結果をパケタイズ処理部124や符号化部123に供給する。
パケタイズ処理部124は、現画像が前画像と類似する場合、符号化データを破棄し、隠蔽用ヘッダ生成部301より供給された隠蔽用ヘッダのみをパケット化し、送信部125に送信させる。
なお、受信装置103の構成は、基本的に図2を参照して説明した場合と同様である。
送信装置102より送信されたパケットは、受信部131により受信され、デパケタイズ処理部132によりデパケタイズされて符号化データが抽出される。抽出された符号化データは、ロス解析部133に供給される。また、このとき、デパケタイズ処理部132は、符号化データとともに、隠蔽用ヘッダも抽出し、ロス解析部133に供給する。
ロス解析部133は、隠蔽用ヘッダに基づいて、記憶部134に記憶されている符号化データを適宜利用しながら、伝送誤りの発生に対してエラー隠蔽を行う。
ロス解析部133は、隠蔽用ヘッダを参照して、データの置き換えに使用可能な過去の符号化データ(つまり、どのピクチャのどのプレシンクトのデータを用いて置き換えるか)を特定する。そして、ロス解析部134は、その特定した符号化データを記憶部134より読みだし、伝送誤りが発生したプレシンクトを、そのデータで置き換える。
復号部135は、ロス解析部134より供給されるエラー隠蔽処理後の符号化データを復号し、ベースバンドの画像データを出力する。
[隠蔽用ヘッダの説明]
次に、隠蔽用ヘッダについて説明する。図15は、隠蔽用ヘッダの構成例を説明する図である。図15に示されるように、隠蔽用ヘッダ340は、32ビットの情報であり、ピクチャID341、プレシンクトID342、置き換え先頭ピクチャID343、RF(Replacement Flag)344、SF(Slide Flag)345、および置き換え先頭プレシンクトID346を含む。
ピクチャID341は、動画像データ全体において現在の(処理対象の)ピクチャを識別する8ビットの識別情報である。プレシンクトID342は、ピクチャ内において現在の(処理対象の)プレシンクトを識別する8ビットの識別情報である。
置き換え先頭ピクチャID343は、それぞれが現在のプレシンクトに置き換え可能なプレシンクトを有し、現在のピクチャまで時間方向に連続するピクチャ群の先頭のピクチャを示す8ビットの識別情報である。
つまり、置き換え先頭ピクチャID343は、現在のプレシンクトを、どのピクチャまで遡って置き換え可能であるかを示す情報である。この置き換え先頭ピクチャID343には、動画像データ全体においてピクチャを識別する識別情報(ピクチャID341と同種のID)がセットされる。
RF344は、1ビットのフラグ情報であり、現在のプレシンクトを、置き換え先頭ピクチャID343より後のピクチャのデータで置き換え可能か否かを示す。当然、置き換え先頭ピクチャID343を参照することにより、過去のピクチャを用いて置き換え可能であるか否かを判定することも可能であるが、RF344を用いる方が、判定が容易になる。
SF345は、1ビットのフラグ情報であり、現在のプレシンクトを、同一ピクチャの過去のプレシンクトのデータで置き換えが可能かを示すビットである。置き換え先頭プレシンクトID346は、現在のピクチャ内において、現在のプレシンクトまで空間方向に連続する、現在のプレシンクトに置き換え可能なプレシンクト群の先頭のプレシンクトを示す6ビットの識別情報である。
つまり、置き換え先頭プレシンクトID346は、現在のプレシンクトを、どのプレシンクトまで遡って置き換え可能であるかを示す情報である。
この置き換え先頭プレシンクトID346には、ピクチャ内において現在のプレシンクトを識別する識別情報(プレシンクトID342と同種のID)が6ビットに圧縮されてセットされる。
なお、この隠蔽用ヘッダ340のビット長は任意である。従って、置き換え先頭プレシンクトID346のビット長をプレシンクトID342と同じビット長としてもよい。また、上述した各情報のビット長も任意である。
以上のように、隠蔽用ヘッダ340には、現在の(処理対象の)プレシンクトを置き換え可能なデータの範囲を示す情報が含まれる。ロス解析部133は、この情報に基づいて、その範囲を把握し、記憶部134に保持されている、その範囲に含まれる符号化データを用いてデータの置き換えを行う。
再度図8を参照して、隠蔽用ヘッダ340の各情報についてより具体的に説明する。なお、プレシンクト253−3が現在の(処理対象の)プレシンクトであるとし、このプレシンクト253−3において伝送誤りが発生したとする。
このときプレシンクト253−3の(全てまたは一部の)パケットに付加された隠蔽用ヘッダ340の、RF344およびSF345の値がオフ(例えば「0」)であれば、プレシンクト253−3に置き換え可能なプレシンクトが存在しない。
また、RF344の値がオフでSF345の値がオン(例えば「1」)であるとき、ピクチャ253内において置き換え可能なプレシンクトが存在する。例えば、置き換え先頭プレシンクトID346がプレシンクト253−2を示す値であれば、プレシンクト253−3は、プレシンクト253−2により置き換えることができる。
また、例えば、置き換え先頭プレシンクトID346がプレシンクト253−1を示す値であれば、プレシンクト253−3は、プレシンクト253−1およびプレシンクト253−2のいずれでも置き換え可能である。
実際には、プレシンクトは数ライン程度の画素で構成される場合が多く、一般的な画像の場合、隣接するプレシンクトの類似性が高く、その差分が小さくなることが多い。つまり、同一ピクチャ内の近いプレシンクトほど、置き換えることができる可能性が高い。
そこで隠蔽用ヘッダ340においては、置き換え先頭プレシンクトID346により、置き換え可能なプレシンクトのうち、現在の(処理対象の)プレシンクトから最も遠い(時間的に最も早い)プレシンクトが示される。換言すれば、置き換え先頭プレシンクトID346により示されるプレシンクトよりも後の(現在のプレシンクトまでの間の)プレシンクトは、置き換え可能であることが保証されている。
また、RF344の値がオンであれば、他のピクチャに置き換え可能なプレシンクトが存在する。例えば、置き換え先頭ピクチャID343がピクチャ252を示す値であれば、プレシンクト253−3は、ピクチャ252の同じ位置のプレシンクト252−3により置き換えることができる。
また、例えば、置き換え先頭ピクチャID343がピクチャ251を示す値であれば、プレシンクト353−3は、ピクチャ251の同じ位置のプレシンクト251−3、および、ピクチャ252の同じ位置のプレシンクト252−3のいずれでも置き換え可能である。
通常の動画像の場合、シーンチェンジ等の特異点を除き、基本的に連続するピクチャの絵柄は近似し、その差分は小さい。つまり、一般的な画像の場合、時間的に近いピクチャほど、置き換え可能なプレシンクトを有する可能性が高い。
そこで隠蔽用ヘッダ340においては、置き換え先頭ピクチャID343により、置き換え可能なプレシンクトを有するピクチャのうち、現在の(処理対象の)ピクチャから最も遠い(時間的に最も早い)ピクチャが示される。換言すれば、置き換え先頭ピクチャID343により示されるピクチャよりも後の(現在のピクチャまでの間の)ピクチャは、置き換え可能なプレシンクトを有することが保証されている。
ただし、実際には、記憶部632がそのデータを保持していなければ、ロス解析部133はプレシンクトを置き換えることができない。例えば、置き換え先頭ピクチャID343がピクチャ251を示す値であり、かつ、記憶部134がピクチャ252のデータを保持していれば、ロス解析部133は、プレシンクト253−3を、プレシンクト252−3で置き換えることができる。
以上のように、隠蔽用ヘッダ340により、置き換え可能なデータが存在する位置(範囲)が示される。つまり、この隠蔽用ヘッダ340を生成する送信装置102が、この範囲を指定する。より具体的には、解析部121は、今回入力されたプレシンクトのデータと、記憶部122に保持されている1つ前のプレシンクトのデータとの差分値を算出する。
また、解析部121は、今回入力されたプレシンクトのデータと、記憶部122に保持されている1つ前のピクチャの同じ位置のプレシンクトのデータとの差分値を算出する。解析部121は、これらの演算結果に基づいて、今回入力されたプレシンクトのデータと、同一ピクチャの1つ前のプレシンクト、または、1つ前の同一位置のプレシンクトとの類似性を判定し、置き換え可能か否かを判定する。
隠蔽用ヘッダ生成部301は、この判定結果に従い、置き換え不可能である場合、置き換え先頭ピクチャID343や置き換え先頭プレシンクトID346の情報を適宜更新する。
[処理の流れの説明]
次に、この場合の、送信装置101により実行される送信処理の流れの例について、図16のフローチャートを参照して説明する。
送信装置101に画像データが入力され、送信処理が開始されると、解析部121は、ステップS201において、図9のステップS101の場合と同様に解析処理を行う。解析処理の詳細については後述する。解析処理が終了すると、処理はステップS202に進む。ステップS202において、符号化部123は、図9のステップS102の場合と同様に、現画像のデータを符号化し符号化データを生成する。
ステップS203において、隠蔽用ヘッダ生成部301は、隠蔽用ヘッダ生成処理を行う。隠蔽用ヘッダ生成処理の詳細については後述する。隠蔽用ヘッダ生成処理が終了すると、処理は、ステップS204に進む。
ステップS204において、パケタイズ処理部124は、図9のステップS103の場合と同様に、ステップS201において実行される解析処理の結果に基づいて、現画像と前画像が類似しているか否かを判定する。類似していない場合、処理は、ステップS205に進む。
ステップS205において、パケタイズ処理部124は、現画像の符号化データに、ステップS203の処理により生成された隠蔽用ヘッダを付加してパケット化する。このとき、生成したパケットが、例えばリードソロモン(RS(Reed-Solomon))符号等の誤り訂正符号を用いて冗長符号化され、冗長データ(冗長パケット)が生成されるようにしても良い。
ステップS206において、送信部125は、図9のステップS105の場合と同様に、パケタイズ処理部124により生成されたパケットを、ネットワーク110を介して受信装置103に送信する。パケットが送信されると送信処理が終了する。
なお、ステップS204において、現画像と前画像が類似していないと判定された場合、処理はステップS207に進む。ステップS207において、パケタイズ処理部124は、処理対象の(現画像の)符号化データを破棄する。パケタイズ処理部124は、ステップS208において、隠蔽用ヘッダのみをパケット化する。ステップS208の処理が終了すると、処理はステップS206に戻り、ステップS208の処理により生成されたパケットが、送信部125により送信される。パケットが送信されると送信処理が終了する。
なお、送信装置102は、以上のような送信処理を、画像データが1プレシンクト分入力される度に繰り返し実行する。
次に、図16のステップS201において実行される解析処理の流れの例を、図17のフローチャートを参照して説明する。
解析処理が開始されると、解析部121は、ステップS221において、記憶部122より前画像の画像データを取得する。ステップS222において、解析部121は、現在の(処理対象の)プレシンクトと、記憶部122より読み出した前ピクチャの同じプレシンクト(1つ前のピクチャの同じ位置のプレシンクト)との差分計算を行う。
ステップS223において、解析部121は、その差分が予め定められた所定の閾値以下であるか否かを判定する。差分が閾値以下であると判定した場合、処理はステップS224に進む。ステップS224において、解析部121は、解析結果として「前ピクチャ置き換え可」を設定し、ステップS226に処理を進める。また、ステップS223において、差分が閾値より大きいと判定した場合、解析部121は、ステップS225に処理を進め、解析結果として「前ピクチャ置き換え不可」を設定し、ステップS225に処理を進める。
解析部121は、ステップS226において、現在のプレシンクトと、記憶部122より読み出した前プレシンクト(1つ前のプレシンクト)との差分計算を行う。ステップS227において、解析部121は、その差分が予め定められた所定の閾値以下であるか否かを判定する。
差分が閾値以下であると判定した場合、解析部121は、ステップS228に処理を進め、解析結果として「前プレシンクト置き換え可」を設定する。また、ステップS227において、差分が閾値より大きいと判定した場合、解析部121は、ステップS229に処理を進め、解析結果として「前プレシンクト置き換え不可」を設定する。
ステップS230において、解析部121は、図10のステップS124の場合と同様に、パケタイズ処理部124に判定結果を通知する。ステップS231において、解析部121は、図10のステップS125の場合と同様に、現画像の画像データを記憶部122に供給し、前画像として使用できるように記憶させる。ステップS231の処理が終了すると、解析処理は終了し、処理は図16のステップS201に戻り、ステップS202以降の処理が実行される。
以上のように、各処理を実行することにより、解析部121は、フレーム間の画像の類似性を判定することができ、隠蔽用ヘッダ生成部123に、隠蔽用ヘッダ340の生成のために必要な情報を提供することができる。
次に、隠蔽用ヘッダ生成部301による隠蔽用ヘッダ生成処理の流れの例を図18のフローチャートを参照して説明する。
隠蔽用ヘッダ生成処理が開始されると、隠蔽用ヘッダ生成部301は、ステップS251において、解析結果として「前ピクチャ置き換え可」がセットされているか否かを判定する。
「前ピクチャ置き換え可」がセットされていると判定した場合、隠蔽用ヘッダ生成部301は、ステップS252に処理を進め、置き換え先頭ピクチャID343の値を前回と同じ値にセットする。ステップS253において、隠蔽用ヘッダ生成部301は、前ピクチャ置き換えフラグであるRF344の値をオン(例えば、「1」)にし、処理をステップS256に進める。
また、ステップS251において、「前ピクチャ置き換え不可」がセットされていると判定した場合、隠蔽用ヘッダ生成部301は、ステップS254に処理を進め、置き換え先頭ピクチャID343の値を現在のピクチャの識別情報に更新する。ステップS255において、隠蔽用ヘッダ生成部301は、前ピクチャ置き換えフラグであるRF344の値をオフ(例えば、「0」)にし、処理をステップS256に進める。
ステップS256において、隠蔽用ヘッダ生成部301、解析結果として「前プレシンクト置き換え可」がセットされているか否かを判定する。
「前プレシンクト置き換え可」がセットされていると判定した場合、隠蔽用ヘッダ生成部301は、処理をステップS257に進め、置き換え先頭プレシンクトID346の値を前回と同じ値にセットする。ステップS258において、隠蔽用ヘッダ生成部301は、前プレシンクト置き換えフラグであるSF345の値をオン(例えば、「1」)にし、隠蔽用ヘッダ生成処理を終了する。
また、ステップS256において、「前プレシンクト置き換え不可」がセットされていると判定した場合、隠蔽用ヘッダ生成部301は、処理をステップS259に進め、置き換え先頭プレシンクトID346の値を現在のプレシンクトの識別情報に更新する。ステップS260において、隠蔽用ヘッダ生成部301は、前プレシンクト置き換えフラグであるSF345の値をオフ(例えば、「」)にし、隠蔽用ヘッダ生成処理を終了する。
以上のように各処理を行うことにより、隠蔽用ヘッダ生成部301は、遅延時間の増大を抑制しながら、伝送誤りによる影響を軽減させるために参照される隠蔽用ヘッダ340を生成することができる。この隠蔽用ヘッダ340が受信装置103に提供されることにより、受信装置103は、ピクチャ単位よりも小さいプレシンクト単位で適切にエラー隠蔽処理を行うことができるようになる。
次に、受信装置103により実行される受信処理の流れの例を図19のフローチャートを参照して説明する。
受信処理が開始されると、受信部131は、ステップS301において、ネットワーク110を介して送信装置102より送信されるパケットを受信する。ステップS302においてデパケタイズ処理部132は、受信されたパケットをデパケタイズし、符号化データを抽出する。
ステップS303において、ロス解析部133は、現在の(処理対象の)プレシンクトの符号化データにおいてロス(エラー)が発生したか否かを判定する。ロスが発生していないと判定した場合、処理は、ステップS304に進む。ステップS304において、ロス解析部133は、符号化データを記憶部134に供給して記憶させ、次回以降、前画像として使用することができるようにする。
ステップS304の処理が終了すると、処理は、ステップS312に進む。
また、ステップS303において、ロスが発生したと判定した場合、処理はステップS305に進む。ステップS305において、ロス解析部133は、隠蔽用ヘッダ340を取得できたか否かを判定する。取得できなかったと判定した場合、正確なエラー隠蔽を行うことが困難であるので、ロス解析部133はエラー隠蔽を行わない。つまり、処理はステップS312に進む。
また、ステップS305において、隠蔽用ヘッダ340を取得したと判定した場合、処理は、ステップS306に進む。ステップS306において、ロス解析部133は、その隠蔽用ヘッダ340の情報に基づいて、前ピクチャの同じプレシンクト(1つ前のピクチャの同じ位置のプレシンクト)で置き換え可能か否かを判定する。RF344の値がオン(例えば「1」)であり、置き換え可能と判定した場合、処理は、ステップS307に進む。
ステップS307において、ロス解析部133は、記憶部134より読み出した前ピクチャのピクチャIDの値が、置き換え先頭ピクチャID343以上であるか否かを判定する。つまり、ロス解析部133は、置き換え先頭ピクチャIDで示されるピクチャの方が、記憶部134より読み出した前ピクチャよりも古いか否かを判定する。
記憶部134より読み出した前ピクチャが、置き換え先頭ピクチャIDで示されるピクチャよりも後であると判定された場合、処理はステップS308に進む。ステップS308において、ロス解析部133は、現在の(処理対象)のプレシンクトを、記憶部134より読み出した前ピクチャの同じ位置のプレシンクトに置き換える。ステップS308の処理が終了すると、処理はステップS312に進む。
また、ステップS307において、記憶部134より読み出した前ピクチャのピクチャIDの値が、置き換え先頭ピクチャIDより小さいと判定された場合、置き換え可能なピクチャのデータが記憶部134に保持されていないので、ロス解析部133はエラー隠蔽を行わない。つまり、処理はステップS312に進む。
また、ステップS306において、記憶部134より読み出した前ピクチャの同一の位置のプレシンクトで置き換えることができないと判定された場合、処理はステップS309に進む。
ステップS309において、ロス解析部631は、記憶部134より読み出した同ピクチャの前プレシンクト(同じピクチャの1つ前のプレシンクト)で置き換え可能か否かを判定する。SF345の値がオフ(例えば「0」)であり、置き換え可能でないと判定された場合、ロス解析部133はエラー隠蔽を行わない。つまり、処理はステップS312に進む。
また、ステップS309において、SF345の値がオン(例えば「1」)であり、記憶部134より読み出した同ピクチャの前プレシンクトで置き換え可能であると判定された場合、処理はステップS310に進む。ステップS310において、ロス解析部133は、記憶部134より読み出された前プレシンクトのプレシンクトIDの値が、置き換え先頭プレシンクトID346以上であるか否かを判定する。
記憶部134より読み出された前プレシンクトのプレシンクトIDの値が、置き換え先頭プレシンクトID346より小さいと判定された場合、記憶部134に置き換え可能なプレシンクトが保持されていないので、ロス解析部133はエラー隠蔽を行わない。つまり、処理はステップS312に進む。
つまり、記憶部134より読み出された前プレシンクトが、置き換え先頭プレシンクトID346により示されるプレシンクトより前のプレシンクトであると判定された場合、記憶部134に置き換え可能なプレシンクトが保持されていないので、ロス解析部133はエラー隠蔽を行わない。つまり、処理はステップS312に進む。
また、記憶部134より読み出された前プレシンクトのプレシンクトIDの値が、置き換え先頭プレシンクトID346以上であると判定された場合、処理はステップS311に進む。つまり、記憶部134より読み出された前プレシンクトが、置き換え先頭プレシンクトID346により示されるプレシンクトより後のプレシンクトであると判定された場合、処理はステップS311に進む。
ステップS311において、ロス解析部133は、現在の(処理対象)のプレシンクトを、記憶部134より読み出した同ピクチャの前プレシンクトに置き換える。ステップS311の処理が終了すると、処理はステップS312に進む。
ステップS312において、復号部135は、符号化データを復号する。ステップS312の処理が終了すると、受信処理は終了する。
受信装置301は以上のように受信処理を行う。これにより、ロス解析部133は、隠蔽用ヘッダ340に基づいて、ピクチャ単位よりも小さいプレシンクト単位で適切にエラー隠蔽処理を行うことができる。つまり、ロス解析部133は、遅延時間の増大を抑制しながら、伝送誤りによる影響を軽減させることができる。
なお、置き換え可能か否かを受信装置103において判断するようにし、上述したような隠蔽用ヘッダ340を用いずに、ピクチャ単位よりも小さい単位で置き換えを行うことができるようにしてもよいが、その場合、受信装置103においてバッファ量が増え、遅延時間が増大してしまう恐れがある。また、受信装置103側においては、データの欠損の可能性があるため、正確な判定に長時間を必要とする恐れがある。
そこで、上述したように、データが揃っている送信装置102において、置き換え可能か否かの判断を行い、隠蔽用ヘッダ340を用いてその情報を受信装置103に通知するようにすることにより、送信装置102は、受信装置103に、遅延時間の増大を抑制しながら、伝送誤りによる影響を軽減させるようにすることができる。
このような場合であっても、送信装置102は、上述したように符号化データの一部を敢えて破棄して送信し、受信装置103にエラー隠蔽させることにより、画像データ伝送において画質劣化を抑制しながら伝送に必要な帯域幅を低減させることができる。
以上のように、送信装置102は、変化の少ないプレシンクトの符号化データを送信しないことによって、伝送帯域を節約することができる。このとき、受信装置側の補完機能を利用するため、送受信間で複雑なやり取りをする必要が無いので、送信装置102を容易に実現することができる。つまり、受信装置103が補完機能を有していればよく、送信装置102の簡単な変更のみで実現することができる。
また、節約した帯域に冗長符号などを挿入すれば、画質のビットレートを下げずに冗長度を増すことができる。さらに、節約した帯域を、次以降のプレシンクトに割り当てることでプレシンクト当たりの平均レートを増加させることもできる。
なお、以上においては符号化データを破棄するように説明したが、破棄するプレシンクトについては、ベースバンドの画像データの状態で破棄し、符号化処理を省略するようにしてもよい。この場合、符号化処理が省略されるので、その分、送信装置102の負荷を低減させることができる。ただし、この場合、同一のプレシンクトについて、解析部121による解析処理と、符号化部123による符号化処理を並行して実行することができない。そのため、データ伝送における遅延時間が増大する恐れがある。例えば、符号化処理の処理対象プレシンクトを、解析処理の処理対象プレシンクトより1つ遅らせることにより、符号化処理と解析処理を並行して実行することができ、遅延時間を多少低減させることは可能である。
上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図20に示されるようなパーソナルコンピュータとして構成されるようにしてもよい。
図20において、パーソナルコンピュータ500のCPU(Central Processing Unit)501は、ROM(Read Only Memory)502に記憶されているプログラム、または記憶部513からRAM(Random Access Memory)503にロードされたプログラムに従って各種の処理を実行する。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU501、ROM502、およびRAM503は、バス504を介して相互に接続されている。このバス504にはまた、入出力インタフェース510も接続されている。
入出力インタフェース510には、キーボードやマウスなどよりなる入力部511、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、有機ELディスプレイ(Organic ElectroLuminescence Display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部512、ハードディスクやSSD(Solid State Drive)などより構成される記憶部513、モデム、LAN(Local Area Network)インタフェース、USB(Universal Serial Bus)インタフェース、IEEE(Institute of Electrical and Electronic Engineers)1394インタフェース、ブルートゥースインタフェース、または無線LANインタフェースなどより構成される通信部514が接続されている。通信部514は、インターネットを含むネットワークを介しての通信処理を行う。
入出力インタフェース510にはまた、必要に応じてドライブ515が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア521が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部513にインストールされる。
上述した一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、ネットワークや記録媒体からインストールされる。
この記録媒体は、例えば、図20に示されるように、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc - Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク(MD(Mini Disc)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア521により構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM502や、記憶部513に含まれるハードディスクなどで構成される。
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムとは、複数のデバイス(装置)により構成される装置全体を表わすものである。
なお、以上において、1つの装置(または処理部)として説明した構成を分割し、複数の装置(または処理部)として構成するようにしてもよい。逆に、以上において複数の装置(または処理部)として説明した構成をまとめて1つの装置(または処理部)として構成されるようにしてもよい。また、各装置(または各処理部)の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置(または処理部)の構成の一部を他の装置(または他の処理部)の構成に含めるようにしてもよい。つまり、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
本発明を適用したネットワークシステムの主な構成例を示すブロック図である。 送信装置および受信装置の構成例を示すブロック図である。 送信装置のより詳細な構成例を示すブロック図である。 分析フィルタリングの概要を説明する図である。 分析フィルタリングの概要を説明する図4に続く図である。 分析フィルタリング結果を説明する図である。 復号部の構成例を示すブロック図である。 前画像の例を説明する図である。 送信処理の流れの例を説明するフローチャートである。 解析処理の流れの例を説明するフローチャートである。 受信処理の流れの例を説明するフローチャートである。 送信処理の他の例を説明するフローチャートである。 送信処理のさらに他の例を説明するフローチャートである。 送信装置および受信装置の他の構成例を示すブロック図である。 隠蔽用ヘッダの構成を説明する模式図である。 送信処理のさらに他の例を説明するフローチャートである。 解析処理の他の例を説明するフローチャートである。 隠蔽用ヘッダ生成処理の流れの例を説明するフローチャートである。 受信処理の他の例を説明するフローチャートである。 本発明を適用したパーソナルコンピュータの主な構成例を示すブロック図である。
符号の説明
100 ネットワークシステム, 102 送信装置, 103 受信装置, 121 解析部, 122 記憶部, 123 符号化部, 124 パケタイズ処理部, 125 送信部, 131 受信部, 132 デパケタイズ処理部, 133 ロス解析部, 134 記憶部, 135 復号部, 151 取得部, 152 比較部, 153 判定部, 154 記憶制御部, 155 制御部, 161 ウェーブレット変換部, 162 量子化部, 163 エントロピ符号化部, 164 レート制御部, 171 破棄部, 172 パケット化部, 173 冗長符号化部, 301 隠蔽用ヘッダ生成部

Claims (10)

  1. 画像データを低域成分と高域成分に分割する処理を再帰的に繰り返すフィルタ処理において最終分割レベルの係数を1ライン生成するために必要なライン数分の画像データであるプレシンクトを処理単位とし、処理対象のプレシンクトの画像データである処理対象画像データと、前記処理対象のプレシンクトに対して所定の相対位置に位置するプレシンクトの画像データであり、前記処理対象画像データより以前に処理される基準画像データとの類似度を求め、前記類似度が所定の閾値に達しているか否かによって、前記処理対象画像データが前記基準画像データと類似しているか否かを求める解析処理を行う解析手段と、
    前記解析手段により解析された前記処理対象画像データを記憶する記憶手段と、
    前記処理対象画像データを符号化する符号化手段と、
    前記解析手段による解析の結果、前記処理対象画像データが前記基準画像データと類似している場合、前記処理対象画像データを破棄する破棄手段と、
    前記解析手段による解析の結果、前記処理対象画像データが前記基準画像データと類似していない場合、前記符号化手段により前記処理対象画像データが符号化されて生成された符号化データを送信する送信手段と
    を備え、
    前記解析手段は、前記記憶手段に記憶されている画像データを取得し、取得した前記画像データを前記基準画像データとして前記解析処理を行う
    情報処理装置。
  2. 前記相対位置は、前記処理対象のプレシンクトと同じピクチャの、前記処理対象のプレシンクトに隣接し、前記処理対象のプレシンクトの1つ前に処理されるプレシンクトである
    請求項1に記載の情報処理装置。
  3. 前記相対位置は、前記処理対象のプレシンクトと同じピクチャの、前記処理対象のプレシンクト近傍の、前記処理対象のプレシンクトより数プレシンクト前に処理されるプレシンクトである
    請求項1に記載の情報処理装置。
  4. 前記相対位置は、前記処理対象のプレシンクトのピクチャより時間的に前のピクチャの、前記処理対象のプレシンクトと同じ位置のプレシンクトである
    請求項1に記載の情報処理装置。
  5. 前記解析手段は、前記処理対象画像データと、前記相対位置が互いに異なる複数の前記基準画像データとの類似度を求める
    請求項1に記載の情報処理装置。
  6. 前記記憶手段は、記憶する画像データを削除する場合、前記解析手段により使用される可能性の無い、若しくは、使用される可能性の低い画像データを優先的に削除する
    請求項1に記載の情報処理装置。
  7. 前記破棄手段により前記処理対象画像データが破棄された場合、前記符号化手段は、前記符号化により生成する前記符号化データの符号量を増やす
    請求項1に記載の情報処理装置。
  8. 前記符号化手段により前記処理対象画像データが符号化されて生成された前記符号化データに対して冗長符号化を行い、冗長データを生成する冗長符号化手段をさらに備える
    請求項1に記載の情報処理装置。
  9. 前記送信手段は、前記処理対象画像データが前記基準画像データと類似している場合、前記冗長符号化手段により生成された前記冗長データを送信する
    請求項8に記載の情報処理装置。
  10. 画像データを処理する情報処理装置の情報処理方法であって、
    解析手段は、画像データを低域成分と高域成分に分割する処理を再帰的に繰り返すフィルタ処理において最終分割レベルの係数を1ライン生成するために必要なライン数分の画像データであるプレシンクトを処理単位とし、処理対象のプレシンクトの画像データである処理対象画像データと、記憶手段から取得した、前記処理対象のプレシンクトに対して所定の相対位置に位置するプレシンクトの画像データであり、前記処理対象画像データより以前に処理される基準画像データとの類似度を求め、前記類似度が所定の閾値に達しているか否かによって、前記処理対象画像データが前記基準画像データと類似しているか否かを求める解析処理を行い、
    前記記憶手段は、解析された前記処理対象画像データを記憶し、
    符号化手段は、前記処理対象画像データを符号化し、
    破棄手段は、解析の結果、前記処理対象画像データが前記基準画像データと類似している場合、前記処理対象画像データを破棄し、
    送信手段は、解析の結果、前記処理対象画像データが前記基準画像データと類似していない場合、前記処理対象画像データが符号化されて生成された符号化データを送信する
    ステップを含む情報処理方法。
JP2008321221A 2008-12-17 2008-12-17 情報処理装置および方法 Expired - Fee Related JP4760902B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2008321221A JP4760902B2 (ja) 2008-12-17 2008-12-17 情報処理装置および方法
US12/580,440 US8391616B2 (en) 2008-12-17 2009-10-16 Information processor and method therefor
EP20090179442 EP2200325B1 (en) 2008-12-17 2009-12-16 Information processor and method therefor
CN2009102537975A CN101754018B (zh) 2008-12-17 2009-12-17 信息处理器及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008321221A JP4760902B2 (ja) 2008-12-17 2008-12-17 情報処理装置および方法

Publications (2)

Publication Number Publication Date
JP2010147678A JP2010147678A (ja) 2010-07-01
JP4760902B2 true JP4760902B2 (ja) 2011-08-31

Family

ID=41785984

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008321221A Expired - Fee Related JP4760902B2 (ja) 2008-12-17 2008-12-17 情報処理装置および方法

Country Status (4)

Country Link
US (1) US8391616B2 (ja)
EP (1) EP2200325B1 (ja)
JP (1) JP4760902B2 (ja)
CN (1) CN101754018B (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4479650B2 (ja) * 2005-11-29 2010-06-09 ソニー株式会社 コミュニケーションシステム、端末装置及びコンピュータプログラム
JPWO2014057555A1 (ja) 2012-10-10 2016-08-25 富士通株式会社 情報処理装置、情報処理システム、情報処理プログラム、及び動画データ送受信方法
JP2014200074A (ja) * 2013-03-15 2014-10-23 株式会社リコー 配信制御システム、配信制御方法、及びプログラム
JP2015220741A (ja) * 2014-05-21 2015-12-07 株式会社リコー 配信制御システム、配信制御方法、及びプログラム
JP6494439B2 (ja) * 2015-06-05 2019-04-03 キヤノン株式会社 通信装置およびその制御方法
US9544474B1 (en) * 2015-06-29 2017-01-10 Mediatek Inc. Video frame transmitting system and video frame transmitting method
CN106303697B (zh) * 2016-08-22 2019-07-02 青岛海信宽带多媒体技术有限公司 一种p帧处理方法及设备
CN109120929B (zh) * 2018-10-18 2021-04-30 北京达佳互联信息技术有限公司 一种视频编码、解码方法、装置、电子设备及系统
JP7238738B2 (ja) * 2019-11-19 2023-03-14 トヨタ自動車株式会社 画像処理システム、処理装置、中継装置及びプログラム
CN111475839B (zh) * 2020-04-06 2023-04-18 华中科技大学 一种用于不可信环境的冗余数据编码方法、存储介质
CN116018806A (zh) * 2020-09-04 2023-04-25 瑞典爱立信有限公司 用来提高对具有远程渲染的扩展现实应用中的延迟变化的容限的分离渲染
CN114124908B (zh) * 2021-08-16 2022-10-21 沭阳林冉塑业有限公司 基于人工智能的设备生产中数据发送的控制方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7006701B2 (en) * 2002-10-09 2006-02-28 Koninklijke Philips Electronics N.V. Sequential digital image compression
FR2872972A1 (fr) * 2004-07-08 2006-01-13 Canon Kk Procede et dispositif de transmission video entre un serveur et un client
US8514933B2 (en) 2005-03-01 2013-08-20 Qualcomm Incorporated Adaptive frame skipping techniques for rate controlled video encoding
US7506071B2 (en) * 2005-07-19 2009-03-17 International Business Machines Corporation Methods for managing an interactive streaming image system
TW200746655A (en) 2005-11-18 2007-12-16 Sony Corp Encoding device and method, decoding device and method, and transmission system
JP4371120B2 (ja) * 2006-05-16 2009-11-25 ソニー株式会社 画像処理装置及び画像処理方法、プログラム及び記録媒体
JP4682914B2 (ja) 2006-05-17 2011-05-11 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP4129694B2 (ja) 2006-07-19 2008-08-06 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP4240331B2 (ja) 2006-11-02 2009-03-18 ソニー株式会社 送信装置および方法、プログラム、並びに通信システム
US7460725B2 (en) * 2006-11-09 2008-12-02 Calista Technologies, Inc. System and method for effectively encoding and decoding electronic information
JP2008252333A (ja) * 2007-03-29 2008-10-16 Pioneer Electronic Corp 映像データ伝送システム

Also Published As

Publication number Publication date
US8391616B2 (en) 2013-03-05
EP2200325A2 (en) 2010-06-23
US20100150454A1 (en) 2010-06-17
EP2200325B1 (en) 2014-06-11
JP2010147678A (ja) 2010-07-01
CN101754018B (zh) 2012-10-03
CN101754018A (zh) 2010-06-23
EP2200325A3 (en) 2011-01-19

Similar Documents

Publication Publication Date Title
JP4760902B2 (ja) 情報処理装置および方法
US8503809B2 (en) Information processing apparatus and method to entropy code upon processing of predetermined number of precincts
JP5162939B2 (ja) 情報処理装置および方法、並びにプログラム
JP4883076B2 (ja) 情報処理装置および方法
JP4360379B2 (ja) 画像処理装置及び画像処理方法、プログラム及び記録媒体
US7565020B2 (en) System and method for image coding employing a hybrid directional prediction and wavelet lifting
US8774283B2 (en) Information processing device and method
JP5672840B2 (ja) 情報処理装置および方法、並びにプログラム
JP5397700B2 (ja) 情報処理装置および方法
JP4129694B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP4656190B2 (ja) 情報処理装置および方法
JP4488027B2 (ja) 情報処理装置および方法、並びに、情報処理システム
US8687488B2 (en) Information processing device and method
JPWO2008093698A1 (ja) 情報処理装置および方法
JP2010278596A (ja) 情報処理装置および方法
JP4350342B2 (ja) 画像処理装置、画像記録装置、カメラシステム、プログラム、記憶媒体及び画像処理方法
WO2011037049A1 (ja) 画像処理装置および方法
JP2011147050A (ja) 画像処理装置および方法
JP2011071649A (ja) 画像処理装置および方法
JP2006303669A (ja) 符号化データ処理装置及び符号化データ処理プログラム
JP2010135912A (ja) 動画像データの圧縮方法
JP4040404B2 (ja) 符号列変換装置及び方法、画像処理装置並びに画像記録装置
JP2004166156A (ja) 画像送信装置、ネットワークシステム、プログラム及び記憶媒体
JP2004023316A (ja) 画像処理装置
JP2004166132A (ja) 画像送信装置、ネットワークシステム、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110404

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110523

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4760902

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees