JP2009095023A - 視感特性を利用した映像符号化装置及び方法 - Google Patents

視感特性を利用した映像符号化装置及び方法 Download PDF

Info

Publication number
JP2009095023A
JP2009095023A JP2008260172A JP2008260172A JP2009095023A JP 2009095023 A JP2009095023 A JP 2009095023A JP 2008260172 A JP2008260172 A JP 2008260172A JP 2008260172 A JP2008260172 A JP 2008260172A JP 2009095023 A JP2009095023 A JP 2009095023A
Authority
JP
Japan
Prior art keywords
value
calculated
range
pixel
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008260172A
Other languages
English (en)
Other versions
JP4995171B2 (ja
Inventor
Sang-Jo Lee
相 祚 李
Shi-Hwa Lee
時 和 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2009095023A publication Critical patent/JP2009095023A/ja
Application granted granted Critical
Publication of JP4995171B2 publication Critical patent/JP4995171B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 視感特性を利用した映像符号化装置及び方法を提供する。
【解決手段】 人間の視感特性を考慮して映像を符号化する装置及び方法に係り、各ピクセルに対応して予測されたピクセルの値に対する誤差値のうち、人間の視感特性上認知できる範囲に該当する値のみ符号化する映像符号化装置及び方法である。
【選択図】 図1

Description

本発明は映像を符号化する方法及び装置係り、さらに詳細には、人間の視感特性を考慮して映像を符号化する方法及び装置に関する。
オーディオコーディング(audio coding)では、人間の聴覚特性を利用した心理音響モデル(psycho-acoustic model)を適用してマスキング臨界値(masking threshold)を設定した後、周波数領域別ビットを異ならせて割り当てて符号化する。
そして、ビデオまたは映像コーディングにおいても、人間の視感特性を利用してコーディングする技術がある。例えば、YUVフォーマットを使用する方法、またはDCT(Discrete Cosine Transform)で量子化行列(quantization matrix)を使用する方法などがある。第一に、YUVフォーマットの場合、主に人間が色度変化に脆弱であるという特性を利用し、色差(chrominance)に対するビットを少なく割り当てる方法で圧縮を実施する。第二に、DCTでは低周波領域と高周波領域とに区別し、人間の視感特性上高周波領域に鈍感な特性を利用することによって、高周波領域の量子化に大きく割り当てられるビットを減らす。
本発明がなそうとする技術的課題は、人間の視感特性を考慮し、認知できる範囲だけ符号化する装置及び方法を提供することである。
前記の課題をなすための本発明による視感特性を利用した映像符号化方法は、映像を構成するピクセルのうち所定ピクセルの値と前記所定ピクセルに対応する参照ピクセルの値との誤差を計算する段階と、前記計算された誤差のうち符号化する範囲を、視感特性上認知できる範囲を判断できる既設定の方式で決定する段階と、前記決定された範囲に該当する前記計算された誤差値だけ符号化する段階とを含むことを特徴とする。
前記の課題をなすための本発明による記録媒体は、映像を構成するピクセルのうち所定ピクセルの値と前記所定ピクセルに対応する参照ピクセルの値との誤差を計算する段階と、前記計算された誤差のうち符号化する範囲を、視感特性上認知できる範囲を判断できる既設定の方式で決定する段階と、前記決定された範囲に該当する前記計算された誤差値だけ符号化する段階とを含む方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することを特徴とする。
前記の課題をなすための本発明による視感特性を利用した映像符号化装置は、映像を構成するピクセルのうち所定ピクセルの値と前記所定ピクセルに対応する参照ピクセルの値との誤差を計算する誤差計算部と、前記計算された誤差のうち符号化する範囲を、視感特性上認知できる範囲を判断できる既設定の方式で決定する符号化範囲決定部と、前記決定された範囲に該当する前記計算された誤差値だけ符号化する符号化部とを備えることを特徴とする。
本発明によって、人間の視感特性を考慮して認知できる範囲だけ符号化する装置及び方法が提供される。
以下、添付された図面を参照しつつ、本発明による視感特性を利用した映像符号化装置及び方法の実施形態について詳細に説明する。
図1は、本発明による視感特性を利用した映像符号化装置についての一実施形態をブロック図で図示したものであり、視感特性を利用した映像符号化装置は、予測部100、誤差計算部110、符号化範囲決定部120及び符号化部130を備えてなる。
予測部100は、入力端子INから映像を構成するピクセルを入力され、既設定の方式によって各ピクセルに対応する参照ピクセルの値を予測する。図10は、予測部100で、所定ピクセルの値を予測する一実施形態を図示した概念図である。図10では、所定ピクセルに対し、上方向、左方向及び左上方向に設けられたピクセルの値を利用して所定ピクセルの値を予測できる。予測部100で、参照ピクセルの値を予測するのに利用する既設定の方式の一実施形態として、エッジ検出法(edge detecting method)を使用して予測できる。かようなエッジ検出法として、IEEE Trans.On Consumer Electronics,Vol 47,No.3,2001,pp.466-476にある「Two low cost algorithms for improved diagonal edgede tection in JPEG-LS」に開示された方法を使用できる。エッジ検出法を利用し、所定ピクセル「x」の値を予測する一実施形態について、図11を利用して説明する。ピクセル「x」にかかわるエッジ検出法のアルゴリズムは、次の通りである。
If(c>=max(a,b))P=min(a,b);
else{
if(c<=min(a,b))P=max(a,b);
elseP=a+b-c;
}
ここで、「P」は、「x」ピクセルに対応する参照ピクセルの値であり、「a」は、左方向に位置したピクセルの値であり、「b」は、上方向に位置したピクセルの値であり、「c」は、左上方向に位置したピクセルの値である。
このアルゴリズムによれば、参照ピクセルの値「P」は、エッジ(edge)が水平方向であるか垂直方向であるかということと、「a」と「b」とのうち大きい値がいずれかであるかとによって決定される。もし「a」及び「b」のうちさらに大きい値より「c」がさらに大きいか、または同じであると仮定すれば、「a」及び「b」のうちさらに小さい値が「a」である場合に水平方向のエッジを有し、参照ピクセルの値「P」は「a」と決定され、「a」及び「b」のうちさらに小さい値が「b」である場合に垂直方向のエッジを有し、参照ピクセルの値「P」は「b」と決定される。一方、「a」及び「b」のうちさらに小さい値が「c」よりさらに大きいか、または同じであると仮定すれば、「a」及び「b」のうちさらに大きい値が「a」である場合に水平方向のエッジを有し、参照ピクセルの値「P」は「a」と決定され、「a」及び「b」のうちさらに大きい値が「b」である場合に垂直方向のエッジを有し、参照ピクセルの値「P」は「b」と決定される。また、「c」が「a」及び「b」のうちさらに小さい値より大きく、「a」及び「b」のうちさらに大きい値より小さいと仮定すれば、エッジの方向を判定し難いので、参照ピクセルの値「P」は、「a」、「b」、「c」いずれも考慮し、「a」に「b」を加算して「c」を減算した値に決定する。
誤差計算部110は、入力端子INから入力されたピクセルの値と、予測部100で各ピクセルに対応して予測した参照ピクセルの値との誤差(error)を計算する。
符号化範囲決定部120は、誤差計算部110で計算された誤差のうち符号化する範囲を決定する。符号化範囲決定部120で範囲を決定するにおいて、人間の視感特性上認知できる範囲を判断できる既設定の方式を利用する。言い換えれば、符号化範囲決定部120は、誤差計算部110で計算された誤差のうち、人間の視感特性上認知できる上位ビットに該当する値と、人間の視感特性上認知できない下位ビットに該当する値とを区別する。
かような符号化範囲決定部120の実施形態として、図2、図3、及び図4がある。
図2は、所定ピクセルのエッジを利用し、誤差計算部110で計算された誤差のうち、符号化する範囲を決定する一実施形態をブロック図で図示したものであり、符号化範囲決定部120は、エッジ計算部200、第1臨界値計算部210及び範囲決定部220を備えてなる。
エッジ計算部200は、各ピクセルのエッジを計算する。ここで、エッジは、所定ピクセルの値と所定ピクセルの周辺に設けられた周辺ピクセルの値との差値をいう。図7を例にとって説明すれば、第nピクセルのエッジは、第(n−1)ピクセルの値に対する第nピクセルの差値をいい、識別番号700に図示された間隔に該当する。
第1臨界値計算部210は、エッジ計算部200で計算された各ピクセルのエッジを既設定の第1値で除算して第1臨界値を計算する。
範囲決定部220は、第1臨界値計算部210で計算された第1臨界値を利用し、誤差計算部110で計算された誤差のうち符号化する範囲を決定する。範囲決定部220で、第1臨界値を利用して誤差のうち符号化する範囲を決定する実施形態として、次に記載された二種がありうる。
第一に、誤差計算部110で計算された誤差のうち、第1臨界値に含まれない値だけ符号化する範囲と決定する。図5Aを例にとって説明すれば、エッジ計算部200では、第nピクセルのエッジとして識別番号500に該当する間隔を計算し、第1臨界値計算部210では、図6に図示されたグラフのように、第1臨界値を除算する値として「8」が既設定であれば、識別番号500に該当する間隔を「8」で除算して第1臨界値を計算し、範囲決定部220は、第nピクセルの値に対し、第1臨界値に該当する誤差を許容する識別番号510に該当する範囲を決定する。
図9Aに図示された第4ピクセルを例にとって、エッジ計算部200で第4ピクセルのエッジとして「25」が計算されたと仮定して説明する。ただし、図9A及び図9Bの実施形態では、予測部100で参照ピクセルを予測するにおいて、周辺ピクセルを利用するのが一般的であるので、エッジと誤差とは同じであると仮定する。第1臨界値計算部210では、第4ピクセルのエッジである「25」を既設定の第1値の「8」で除算して第1臨界値である「3.125」を計算し、範囲決定部220は、第1臨界値である「3.125」以下に該当する下位2ビットを符号化しない範囲と決定し、第1臨界値である「3.125」以上に該当する上位3ビットを符号化する範囲と決定する。これにより、範囲決定部220は、第4ピクセルの誤差である「25」に該当する「11001」のうち上位3ビットである「110」のみ符号化する範囲と決定し、下位2ビットである「01」は、符号化しない範囲と決定する。
第二に、誤差計算部110で計算された誤差のうち、第1臨界値に含まれない範囲、及び符号化器で符号化されていないエラー値を復号化器で復元するアルゴリズムを考慮し、符号化する範囲と決定する。符号化器で符号化されていないエラー値は、復号化器で既設定のアルゴリズムによって復元される。ここで、既設定のアルゴリズムの例として、符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の期待値、平均値及び中間値に復号化端で復元され、各エラー値に対応する復元される値をテーブルに既保存にして読み出すことによって復元できる。もし符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の中間値に復号化端で復元する場合、第1臨界値によって決定された符号化しない下位ビットを1ビット増加させることができるので、第1臨界値によって決定された符号化する上位ビットを1ビット減少させることができる。
例えば、第一の方式で説明した例である図9Aに図示された第4ピクセルの場合、第1臨界値計算部210で計算された第1臨界値である「3.125」を基準として、範囲決定部220は、第1臨界値である「3.125」以下に該当する下位2ビットを符号化しない範囲と決定し、第1臨界値である「3.125」以上に該当する上位3ビットを符号化する範囲と決定する。これにより、範囲決定部220は、第4ピクセルの誤差である「25」に該当する「11001」のうち、上位3ビットである「110」のみ符号化する範囲と決定し、下位2ビットである「01」は、符号化しない範囲と決定する。
しかし、第二の方式によって、符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の中間値に復号化端で復元する場合、上位ビット中のうち1ビットをさらに符号化せずに、上位2ビットである「11」のみ符号化する範囲と決定し、下位3ビットは、符号化しない範囲と決定する。この場合も、符号化器で伝送していない下位3ビットで表現できる「000」ないし「111」の中間値である「100」に復号化器で下位3ビットを復元するので、符号化端から伝送された上位2ビットである「11」と合成し、最終的に「11100」に復元する。このように復元された「11100」は、第4ピクセルの誤差である「11001」と「11」しか差がないので、第1臨界値に含まれる。従って、第1臨界値に決定された上位ビットのうち、1ビットをより少なく符号化する範囲と決定したとしても、復号化器で臨界値範囲内に該当するピクセルの値に復元されるために、人間の視感特性上認知できない。
これと同じ方式で、図9Aに図示された第1ないし第3ピクセル及び第5ないし第10ピクセルに対するエッジとして、第1臨界値を計算することによって、図9Bに図示されたように、点線より上位ビットに該当するビットを符号化する範囲と決定できる。図9A及び図9Bの実施形態は、第1値が「8」に既設定にして仮定したので、上位2ビットのみ符号化する範囲と決定できる。
換言すれば、所定ピクセルのエッジと参照ピクセルの誤差とが同じであり、第1臨界値を除算する既設定の値が「8」であると仮定すれば、第一の方式によって具現する場合、上位3ビットのみ符号化する範囲と決定し、第二の方式によって具現する場合、符号化器で符号化されていない下位ビットを復号化器で復元するとき、中間値を加算する方式のアルゴリズムを取るならば、上位2ビットのみ符号化する範囲と決定すればよい。しかしここで、既設定の値である「8」に限定して実施するものではなく、ディスプレイ特性のような実施環境によって、他の値を既設定にして実施することもできる。
図3は、所定ピクセルの周辺に設けられた周辺ピクセルを利用し、誤差計算部110で計算された誤差のうち、符号化する範囲を決定する一実施形態をブロック図で図示したものであり、符号化範囲決定部120は、周辺差値計算部300、第2臨界値計算部310及び範囲決定部320を備えてなる。
周辺差値計算部300は、各ピクセルの周辺に設けられた周辺ピクセル間の差値を計算する。図8を例にとって説明すれば、第nピクセルの周辺ピクセル間の差値は、第nピクセルの周辺に設けられた第(n−1)ピクセルと第(n+1)ピクセルとの差値をいい、識別番号800に図示された間隔に該当する。
第2臨界値計算部310は、周辺差値計算部300で計算された各ピクセルの周辺ピクセル間の差値を既設定の第2値で除算して第2臨界値を計算する。
ここで既設定の値は、図2に記述された第1値と互いに異りうる。特定ピクセルの周辺に設けられた周辺ピクセル間の差値は、特定ピクセルと周辺ピクセルとの最大差値に「2」を乗算した値以上に該当する。かような関係を図8を利用して説明すれば、第nピクセルの周辺ピクセルには、第(n−1)ピクセルと第(n+1)ピクセルとがある。第nピクセルとその周辺ピクセルとのうち一つである第(n−1)ピクセルの差値である第1エッジは、識別番号810に該当する値であり、第nピクセルと残りの周辺ピクセルである第(n+1)ピクセルとの差値である第2エッジは、識別番号820に該当する。それらの関係を数式で記載すれば、次の通りである。
Figure 2009095023
ここで、「edge1」は第1エッジであり、「edge2」は第2エッジであり、「neighbor」は周辺ピクセル間の差値をいう。
エッジと周辺ピクセルとの差値が式(1)のような関係を有するために、エッジが周辺ピクセル間の差値と同じであると仮定し、第1値を「2」で除算した値を第2値に既設定にできる。
範囲決定部320は、第2臨界値計算部310で計算された第2臨界値を利用し、誤差計算部110で計算された誤差のうち符号化する範囲を決定する。範囲決定部320で、第2臨界値を利用し、誤差のうち符号化する範囲を決定する実施形態として、次に記載された二種がありうる。
第一に、誤差計算部110で計算された誤差のうち、第2臨界値に含まれない値のみ符号化する範囲と決定する。図5Bを例にとって説明すれば、周辺差値計算部300では、第nピクセルの周辺ピクセルに該当する第(n−1)ピクセルと第(n+1)ピクセルとの差値である識別番号520に該当する間隔を計算し、第2臨界値計算部310では、第2臨界値を除算する第2値として「16」が既設定であれば、識別番号520に該当する間隔を「16」で除算して第2臨界値を計算し、範囲決定部320は、第nピクセルの値に対して第2臨界値に含まれる誤差を許容する。
図9Aに図示された第4ピクセルを例にとって、周辺差値計算部300で第4ピクセルの周辺ピクセルの差値として「46」が計算されたと仮定して説明する。ただし、図9A及び図9Bの実施形態では、予測部100で参照ピクセルを予測するにおいて、周辺ピクセルを利用するのが一般的であるので、エッジと誤差とは同じであると仮定する。第2臨界値計算部310では、第4ピクセルの周辺ピクセルの差値である「46」を「16」で除算し、第2臨界値である「2.875」を計算し、範囲決定部320は、第2臨界値である「2.875」以下に該当する下位2ビットを符号化しない範囲と決定し、第2臨界値である「2.875」以上に該当する上位3ビットを符号化する範囲と決定する。これにより、範囲決定部320は、第4ピクセルの誤差である「25」に該当する「11001」のうち、上位3ビットである「110」のみ符号化する範囲と決定し、下位2ビットである「01」は、符号化しない範囲と決定する。
第二に、誤差計算部110で計算された誤差のうち、第2臨界値に含まれない範囲、及び符号化器で符号化されていないエラー値を復号化器で復元するアルゴリズムを考慮し、符号化する範囲と決定する。符号化器で符号化されないエラー値は、復号化器で既設定のアルゴリズムによって復元される。ここで、既設定のアルゴリズムの例として、符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の期待値、平均値及び中間値に復号化端で復元され、各エラー値に対応する復元される値をテーブルに既保存にして読み出すことによって復元できる。もし符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の中間値に復号化端で復元する場合、第2臨界値によって決定された符号化しない下位ビットを2ビット増加させることができるので、第2臨界値によって決定された符号化する上位ビットを1ビット減少させることができる。これと同じ方式で、図9Aに図示された第1ないし第3ピクセル及び第5ないし第10ピクセルに対する周辺ピクセルの差値でもって第2臨界値を計算することによって、図9Bに図示されたように、太い実線より上位ビットに該当するビットを符号化する範囲と決定できる。図9A及び図9Bの実施形態は、第2値を「16」に既設定にして仮定したので、上位3ビットのみ符号化する範囲と決定できる。
図4は、所定ピクセルのエッジまたは所定ピクセルの周辺に設けられた周辺ピクセルの差値を利用し、誤差計算部110で計算された誤差のうち、符号化する範囲を決定する一実施形態をブロック図で図示したものであり、符号化範囲決定部120は、エッジ計算部400、第1臨界値計算部410、周辺差値計算部420、第2臨界値計算部430及び範囲決定部440を備えてなる。
エッジ計算部400は、各ピクセルのエッジを計算する。ここでエッジは、所定ピクセルの値と所定ピクセルの周辺に設けられた周辺ピクセルの値との差値をいう。図7を例にとって説明すれば、第nピクセルのエッジは、第(n−1)ピクセルの値に対する第nピクセルの差値をいい、識別番号700に図示された間隔に該当する。
第1臨界値計算部410は、エッジ計算部400で計算された各ピクセルのエッジを既設定の第1値で除算し、第1臨界値を計算する。
周辺差値計算部420は、各ピクセルの周辺に設けられた周辺ピクセル間の差値を計算する。図8を例にとって説明すれば、第nピクセルの周辺ピクセル間の差値は、第nピクセルの周辺に設けられた第(n−1)ピクセルと第(n+1)ピクセルとの差値をいい、識別番号800に図示された間隔に該当する。
第2臨界値計算部430は、周辺差値計算部420で計算された各ピクセルの周辺ピクセル間の差値を既設定の第2値で除算し、第2臨界値を計算する。
ここで、既設定の値は、図2に記述された第1値と互いに異なりうる。特定ピクセルの周辺に設けられた周辺ピクセル間の差値は、特定ピクセルと周辺ピクセルとの最大差値に「2」を乗算した値以上に該当する。かような関係を図8を利用して説明すれば、第nピクセルの周辺ピクセルには、第(n−1)ピクセルと第(n+1)ピクセルとがある。第nピクセルとその周辺ピクセルのうち一つである第(n−1)ピクセルとの差値である第1エッジは、識別番号810に該当する値であり、第nピクセルと残りの周辺ピクセルである第(n+1)ピクセルとの差値である第2エッジは、識別番号820に該当する。それら関係を数式で記載すれば、次の通りである。
Figure 2009095023
ここで、「edge1」は第1エッジであり、「edge2」は第2エッジであり、「neighbor」は周辺ピクセル間の差値をいう。
エッジと周辺ピクセルとの差値が式(2)のような関係を有するために、エッジが周辺ピクセル間の差値と同じであると仮定し、第1値を「2」で除算した値を第2値に既設定にできる。
範囲決定部440は、第1臨界値計算部410で計算された第1臨界値と第2臨界値計算部430で計算された第2臨界値とのうち最も大きい臨界値を選択し、最も大きい臨界値を利用し、誤差計算部110で計算された誤差のうち符号化する範囲を決定する。もし第1臨界値が第2臨界値より大きいならば、図2に開示された範囲決定部220と同じ方式で、誤差計算部110で計算された誤差のうち符号化する範囲を決定し、もし第2臨界値が第1臨界値より大きいならば、図3に開示された範囲決定部320と同じ方式で、誤差計算部110で計算された誤差のうち符号化する範囲を決定する。
図9A及び図9Bは、範囲決定部440で、範囲を決定する実施形態をテーブルで図示したものである。図9Aは、第1ないし第10ピクセルのエッジと、第1ないし第10ピクセルの周辺ピクセルとの差値をテーブルで図示したものであり、図9Bは、第1ないし第10ピクセルの誤差を上位ビットから下位ビット順にビットプレーン(bit-plane)単位で表現したテーブルを図示したものである。ただし、図9A及び図9Bの実施形態では、予測部100で参照ピクセルを予測するにおいて、周辺ピクセルを利用するのが一般的であるので、エッジと誤差とは同じであると仮定する。
第1臨界値計算部410で計算された第1臨界値は、図9Bで点線で表示されており、第2臨界値計算部430で計算された第2臨界値は、図9Bで実線で表示されている。範囲決定部440は、点線と実線との中にさらに大きい値を臨界値に決定し、決定された臨界値より上位ビットに設けられた誤差のビットプレーンを符号化する範囲と決定する。
また、図1に図示された実施形態について説明すれば、符号化部130は、符号化範囲決定部120で決定された範囲に該当する誤差計算部110で計算された誤差のみ符号化する。さらに詳細に、符号化部130は、符号化範囲決定部120で符号化すると決定した上位ビットに該当する誤差計算部110で計算された誤差のみ符号化してビットストリームを生成することによって、出力端子OUTを介して出力する。
図12は、本発明による視感特性を利用した映像符号化方法にかかわる一実施形態をフローチャートで図示したものである。
まず、映像を構成するピクセルを入力され、既設定の方式によって第nピクセルに対応する参照ピクセルの値を予測する(第1200段階)。図10は、第1200段階で、所定ピクセルの値を予測する一実施形態を図示した概念図である。図10では、所定ピクセルに対し、上方向、左方向及び左上方向に設けられたピクセルの値を利用して所定ピクセルの値を予測できる。第1200段階で、参照ピクセルの値を予測するのに利用する既設定方式の一実施形態として、エッジ検出法(edge detecting method)を使用して予測できる。かようなエッジ検出法として、IEEE Trans.On Consumer Electronics,Vol 47,No.3,2001,pp.466−476にある「Two low cost algorithms for improved diagonal edge detection in JPEG-LS」に開示された方法を使用できる。エッジ検出法を利用し、所定ピクセル「x」の値を予測する一実施形態について図11を利用して説明する。ピクセル「x」に対するエッジ検出法のアルゴリズムは、次の通りである。
if(c>=max(a,b))P=min(a,b);
else{
if(c<=min(a,b))P=max(a,b);
else P=a+b-c;
ここで、「P」は「x」ピクセルに対応する参照ピクセルの値であり、「a」は左方向に位置したピクセルの値であり、「b」は上方向に位置したピクセルの値であり、「c」は左上方向に位置したピクセルの値である。
このアルゴリズムによれば、参照ピクセルの値「P」は、エッジ(edge)が水平方向であるか垂直方向であるかということと、「a」及び「b」のうち大きい値がいずれであるかということとによって決定される。もし「a」及び「b」のうちさらに大きい値より「c」がさらに大きいか、または同じであると仮定すれば、「a」及び「b」のうちさらに小さい値が「a」である場合に水平方向のエッジを有し、参照ピクセルの値「P」は「a」と決定され、「a」及び「b」のうちさらに小さい値が「b」である場合に垂直方向のエッジを有し、参照ピクセルの値「P」は「b」と決定される。一方、「a」及び「b」のうちさらに小さい値が「c」より大きいか、または同じであると仮定すれば、「a」及び「b」のうちさらに大きい値が「a」である場合に水平方向のエッジを有し、参照ピクセルの値「P」は「a」と決定され、「a」及び「b」のうちさらに大きい値が「b」である場合に垂直方向のエッジを有し、参照ピクセルの値「P」は「b」と決定される。また、「c」が「a」及び「b」のうちさらに小さい値より大きく、「a」及び「b」のうちさらに大きい値より小さいと仮定すれば、エッジの方向を判定し難いので、参照ピクセルの値「P」は、「a」、「b」、「c」いずれも考慮し、「a」に「b」を加算して「c」を減算した値に決定する。
第1200段階で第nピクセルに対応して予測された参照ピクセルの値と第nピクセルの値との誤差(error)を計算する(第1210段階)。
第1210段階で計算された第nピクセルの誤差のうち符号化する範囲を決定する(第1220段階)。第1220段階で範囲を決定するにおいて、人間の視感特性上認知できる範囲を判断できる既設定方式を利用する。言い換えれば、第1220段階では、第1210段階で計算された誤差のうち、人間の視感特性上認知できる上位ビットに該当する値と人間の視感特性上認知できない下位ビットに該当する値とを区別する。
かような第1220段階の実施形態として、図13、図14及び図15がある。
図13は、第nピクセルのエッジを利用し、第1210段階で計算された第nピクセルの誤差のうち符号化する範囲を決定する一実施形態をフローチャートで図示したものである。
まず、第nピクセルのエッジを計算する(第1300段階)。ここでエッジは、所定ピクセルの値と所定ピクセルの周辺に設けられた周辺ピクセルの値との差値をいう。図7を例にとって説明すれば、第nピクセルのエッジは、第(n−1)ピクセルの値に対する第nピクセルの差値をいい、識別番号700に図示された間隔に該当する。
第1300段階で計算された第nピクセルのエッジを既設定の第1値で除算し、第1臨界値を計算する(第1310段階)。
第1310段階で計算された第nピクセルの第1臨界値を利用し、第1210段階で計算された第nピクセルの誤差のうち符号化する範囲を決定する(第1320段階)。第1320段階で、第1臨界値を利用し、誤差のうち符号化する範囲を決定する実施形態として、次に記載された二種がありうる。
第一に、第1210段階で計算された誤差のうち、第1臨界値に含まれない値のみ符号化する範囲と決定する。図5Aを例にとって説明すれば、第1300段階では、第nピクセルのエッジとして識別番号500に該当する間隔を計算し、第1310段階では、図6に図示されたグラフのように、第1臨界値を除算する値として「8」が既設定であれば、識別番号500に該当する間隔を「8」で除算して第1臨界値を計算し、第1320段階では、第nピクセルの値に対して第1臨界値に該当する誤差を許容する識別番号510に該当する範囲を決定する。
図9Aに図示された第4ピクセルを例にとって、第1300段階で、第4ピクセルのエッジとして「25」が計算されたと仮定して説明する。ただし、図9A及び図9Bの実施形態では、第1200段階で参照ピクセルを予測するにおいて、周辺ピクセルを利用するのが一般的であるので、エッジと誤差とは同じであると仮定する。第1310段階では、第4ピクセルのエッジである「25」を既設定の第1値である「8」で除算し、第1臨界値である「3.125」を計算し、第1320段階では、第1臨界値である「3.125」以下に該当する下位2ビットを符号化しない範囲と決定し、第1臨界値である「3.125」以上に該当する上位3ビットを符号化する範囲と決定する。これにより、第1320段階では、第4ピクセルの誤差である「25」に該当する「11001」のうち、上位3ビットである「110」のみ符号化する範囲と決定し、下位2ビットである「01」は符号化しない範囲と決定する。
第二に、第1210段階で計算された誤差のうち、第1臨界値に含まれない範囲、及び符号化器で符号化されていないエラー値を復号化器で復元するアルゴリズムを考慮し、符号化する範囲と決定する。符号化器で符号化されていないエラー値は、復号化器で既設定のアルゴリズムによって復元される。ここで、既設定のアルゴリズムの例として、符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の期待値、平均値及び中間値に復号化端で復元され、各エラー値に対応する復元される値をテーブルに既保存にして読み出すことによって復元できる。もし符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の中間値に復号化端で復元する場合、第1臨界値によって決定された符号化しない下位ビットを1ビット増加させることができるので、第1臨界値によって決定された符号化する上位ビットを1ビット減少させることができる。
例えば、第一の方式で説明した例である図9Aに図示された第4ピクセルの場合、第1310段階で計算された第1臨界値である「3.125」を基準として、第1320段階では、第1臨界値である「3.125」以下に該当する下位2ビットを符号化しない範囲と決定し、第1臨界値である「3.125」以上に該当する上位3ビットを符号化する範囲と決定する。これにより、第1320段階では、第4ピクセルの誤差である「25」に該当する「11001」のうち、上位3ビットである「110」のみ符号化する範囲と決定し、下位2ビットである「01」は、符号化しない範囲と決定する。
しかし、第二の方式によって符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の中間値に復号化端で復元する場合、上位ビットのうち1ビットをさらに符号化せずに、上位2ビットである「11」のみ符号化する範囲と決定し、下位3ビットは、符号化しない範囲と決定する。この場合も、符号化器で伝送していない下位3ビットで表現できる「000」ないし「111」の中間値である「100」に復号化器で下位3ビットを復元するので、符号化端で伝送された上位2ビットである「11」と合成し、最終的に「11100」に復元する。このように復元された「11100」は、第4ピクセルの誤差である「11001」と「11」しか差がないので、第1臨界値に含まれる。従って、第1臨界値に決定された上位ビットのうち、1ビットをより少なく符号化する範囲と決定したとしても、復号化器で臨界値範囲内に該当するピクセルの値に復元されるために、人間の視感特性上認知できない。
これと同じ方式で、図9Aに図示された第1ないし第3ピクセル及び第5ないし第10ピクセルに対するエッジとして第1臨界値を計算することによって、図9Bに図示されたように、点線より上位ビットに該当するビットを符号化する範囲と決定できる。図9A及び図9Bの実施形態は、第1値が「8」に既設定にして仮定したので、上位2ビットのみ符号化する範囲と決定できる。
換言すれば、所定ピクセルのエッジと参照ピクセルの誤差とが同じであり、第1臨界値を除算する既設定の値が「8」であると仮定すれば、第一の方式によって具現する場合、上位3ビットのみ符号化する範囲と決定し、第二の方式によって具現する場合、符号化器で符号化されていない下位ビットを復号化器で復元するとき、中間値を加算する方式のアルゴリズムを取るならば、上位2ビットのみ符号化する範囲と決定すればよい。しかしここで、既設定の値である「8」に限定して実施するものではなく、ディスプレイ特性のような実施環境によって、他の値を既設定にして実施することもできる。
図14は、第nピクセルの周辺に設けられた周辺ピクセルを利用し、第1210段階で計算された誤差のうち符号化する範囲を決定する一実施形態をフローチャートで図示したものである。
まず、第nピクセルの周辺に設けられた周辺ピクセル間の差値を計算する(第1400段階)。図8を例にとって説明すれば、第nピクセルの周辺ピクセル間の差値は、第nピクセルの周辺に設けられた第(n−1)ピクセルと第(n+1)ピクセルとの差値をいい、識別番号800に図示された間隔に該当する。
第1400段階で計算された各ピクセルの周辺ピクセル間の差値を既設定の第2値で除算し、第2臨界値を計算する(第1410段階)。
ここで、既設定の値は、図2に記述された第1値と互いに異なりうる。特定ピクセルの周辺に設けられた周辺ピクセル間の差値は、特定ピクセルと周辺ピクセルとの最大差値に「2」を乗算した値以上に該当する。かような関係について図8を利用して説明すれば、第nピクセルの周辺ピクセルには、第(n−1)ピクセルと第(n+1)ピクセルとがある。第nピクセルとその周辺ピクセルのうち一つである第(n−1)ピクセルとの差値である第1エッジは、識別番号810に該当する値であり、第nピクセルと残りの周辺ピクセルである第(n+1)ピクセルとの差値である第2エッジは、識別番号820に該当する。それらの関係を数式で記載すれば、次の通りである。
Figure 2009095023
ここで、「edge1」は第1エッジであり、「edge2」は第2エッジであり、「neighbor」は周辺ピクセル間の差値をいう。
エッジと周辺ピクセルとの差値が式(1)のような関係を有するために、エッジが周辺ピクセル間の差値と同じであると仮定し、第1値を「2」で除算した値を第2値に既設定にできる。
第1410段階で計算された第2臨界値を利用し、第1210段階で計算された誤差のうち符号化する範囲を決定する(第1420段階)。第1420段階で、第2臨界値を利用し、誤差のうち符号化する範囲を決定する実施形態として、次に記載された二種がありうる。
第一に、第1410段階で計算された誤差のうち、第2臨界値に含まれない値のみ符号化する範囲と決定する。図5Bを例にとって説明すれば、第1400段階では、第nピクセルの周辺ピクセルに該当する第(n−1)ピクセルと第(n+1)ピクセルとの差値である識別番号520に該当する間隔を計算し、第1410段階では、第2臨界値を除算する第2値として「16」が既設定であれば、識別番号520に該当する間隔を「16」で除算して第2臨界値を計算し、第1420段階では、第nピクセルの値に対して第2臨界値に含まれる誤差を許容する。
図9Aに図示された第4ピクセルを例にとって、第1400段階で、第4ピクセルの周辺ピクセルの差値として「46」が計算されたと仮定して説明する。ただし、図9A及び図9Bの実施形態では、第1200段階で参照ピクセルを予測するにおいて、周辺ピクセルを利用するのが一般的であるので、エッジと誤差とは同じであると仮定する。第1410段階では、第4ピクセルの周辺ピクセルの差値である「46」を「16」で除算し、第2臨界値である「2.875」を計算し、第1420段階では、第2臨界値である「2.875」以下に該当する下位2ビットを符号化しない範囲と決定し、第2臨界値である「2.875」以上に該当する上位3ビットを符号化する範囲と決定する。これにより、第1420段階では、第4ピクセルの誤差である「25」に該当する「11001」のうち、上位3ビットである「110」のみ符号化する範囲と決定し、下位2ビットである「01」は、符号化しない範囲と決定する。
第二に、第1210段階で計算された誤差のうち、第2臨界値に含まれない範囲、及び符号化器で符号化されていないエラー値を復号化器で復元するアルゴリズムを考慮し、符号化する範囲と決定する。符号化器で符号化されていないエラー値は、復号化器で既設定のアルゴリズムによって復元される。ここで、既設定のアルゴリズムの例として、符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の期待値、平均値及び中間値に復号化端で復元され、各エラー値に対応する復元される値をテーブルに既保存にして読み出すことによって復元できる。もし符号化器で符号化されていないエラー値の範囲内で可能なあらゆる数の中間値に復号化端で復元する場合、第2臨界値によって決定された符号化しない下位ビットを2ビット増加させることができるので、第2臨界値によって決定された符号化する上位ビットを1ビット減少させることができる。これと同じ方式で、図9Aに図示された第1ないし第3ピクセル及び第5ないし第10ピクセルに対する周辺ピクセルの差値でもって第2臨界値を計算することによって、図9Bに図示されたように太い実線より上位ビットに該当するビットを符号化する範囲と決定できる。図9A及び図9Bの実施形態は、第2値を「16」に既設定にして仮定したので、上位3ビットのみ符号化する範囲と決定できる。
図15は、第nピクセルのエッジまたは第nピクセルの周辺に設けられた周辺ピクセルの差値を利用し、第1210段階で計算された誤差のうち、符号化する範囲を決定する一実施形態をフローチャートで図示したものである。
まず、第nピクセルのエッジを計算する(第1500段階)。ここでエッジは、所定ピクセルの値と所定ピクセルの周辺に設けられた周辺ピクセルの値との差値をいう。図7を例にとって説明すれば、第nピクセルのエッジは、第(n−1)ピクセルの値に対する第nピクセルの差値をいい、識別番号700に図示された間隔に該当する。
第1500段階で計算された第nピクセルのエッジを既設定の第1値で除算し、第1臨界値を計算する(第1510段階)。
第nピクセルの周辺に設けられた周辺ピクセル間の差値を計算する(第1520段階)。図8を例にとって説明すれば、第nピクセルの周辺ピクセル間の差値は、第nピクセルの周辺に設けられた第(n−1)ピクセルと第(n+1)ピクセルとの差値をいい、識別番号800に図示された間隔に該当する。
第1520段階で計算された各ピクセルの周辺ピクセル間の差値を既設定の第2値で除算し、第2臨界値を計算する(第1530段階)。
ここで、既設定の値は、図2に記述された第1値と互いに異なりうる。特定ピクセルの周辺に設けられた周辺ピクセル間の差値は、特定ピクセルと周辺ピクセルとの最大差値に「2」を乗算した値以上に該当する。かような関係について図8を利用して説明すれば、第nピクセルの周辺ピクセルには、第(n−1)ピクセルと第(n+1)ピクセルとがある。第nピクセルとその周辺ピクセルのうち一つである第(n−1)ピクセルとの差値である第1エッジは、識別番号810に該当する値であり、第nピクセルと残りの周辺ピクセルである第(n+1)ピクセルとの差値である第2エッジは、識別番号820に該当する。それらの関係を数式で記載すれば、次の通りである。
Figure 2009095023
ここで、「edge1」は第1エッジであり、「edge2」は第2エッジであり、「neighbor」は周辺ピクセル間の差値をいう。
エッジと周辺ピクセルとの差値が式(4)のような関係を有するために、エッジが周辺ピクセル間の差値と同じであると仮定し、第1値を「2」で除算した値を第2値に既設定にできる。
第1510段階で計算された第1臨界値と第1530段階で計算された第2臨界値とのうち、いずれの臨界値がさらに大きいかを判断する(第1540段階)。
第1540段階で、第1臨界値が第2臨界値より大きいと判断されれば、第1510段階で計算された第1臨界値を利用し、第1210段階で計算された誤差のうち符号化する範囲を決定する(第1550段階)。第1550段階では、図13の第1320段階で開示された実施形態と同一に実施できる。
第1540段階で、第2臨界値が第1臨界値より大きいと判断されれば、第1510段階で計算された第2臨界値を利用し、第1210段階で計算された誤差のうち符号化する範囲を決定する(第1560段階)。第1560段階では、図14の第1420段階で開示された実施形態と同一に実施できる。
図9A及び図9Bは、第1540段階ないし第1560段階で範囲を決定する実施形態をテーブルで図示したものである。図9Aは、第1ないし第10ピクセルのエッジと第1ないし第10ピクセルの周辺ピクセルとの差値をテーブルで図示したものであり、図9Bは、第1ないし第10ピクセルの誤差を上位ビットから下位ビット順にビットプレーン(bit-plane)単位で表現したテーブルを図示したものである。ただし、図9A及び図9Bの実施形態では、予測部100で参照ピクセルを予測するにおいて、周辺ピクセルを利用するのが一般的であるので、エッジと誤差とは同じであると仮定する。
第1510段階で計算された第1臨界値は、図9Bで点線で表示されており、第1530段階で計算された第2臨界値は、図9Bで実線で表示されている。第1540段階ないし第1560段階は、点線と実線とのうちさらに大きい値を臨界値に決定し、決定された臨界値より上位ビットに設けられた誤差のビットプレーンを符号化する範囲と決定する。
また、図12に図示された実施形態について説明すれば、第1220段階で決定された範囲に該当する第1230段階で計算された第nピクセルの誤差のみ符号化する(第1230段階)。さらに詳細に、第1230段階では、第1220段階で符号化することに決定した上位ビットに該当する第1210段階で計算された誤差のみ符号化する。
第1230段階後に、第nピクセルが符号化する最後のピクセルであるか否かを判断する(第1240段階)。
もし第nピクセルが符号化する最後のピクセルではないと判断されれば、「n」に「1」を加算し、第1200段階ないし第1230段階を反復して行う。
かような本発明に対する理解を助けるために、図面に図示された実施形態を参考にして説明したが、それらは例示的なものに過ぎず、当分野で当業者ならば、それらから多様な変形及び均等な他実施形態が可能であるという点を理解することができるであろう。従って、本発明の真の技術的保護範囲は、特許請求の範囲によってのみ決まるのである。
また本発明は、コンピュータで読み取り可能な記録媒体にコンピュータ(情報処理機能を有する装置をいずれも含む)で読み取り可能なコードとして具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存されるあらゆる種類の記録装置を含む。コンピュータで読み取り可能な記録装置の例としては、ROM(Read-Only Memory)、RAM(Random-Access Memory)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
本発明の視感特性を利用した映像符号化装置及び方法は、例えば、映像関連の技術分野に効果的に適用可能である。
本発明による視感特性を利用した映像符号化装置についての一実施形態を示したブロック図である。 所定ピクセルのエッジを利用し、誤差計算部で計算された誤差のうち、符号化する範囲を決定する一実施形態を示したブロック図である。 所定ピクセルの周辺に設けられた周辺ピクセルを利用し、誤差計算部で計算された誤差のうち、符号化する範囲を決定する一実施形態を示したブロック図である。 所定ピクセルのエッジまたは所定ピクセルの周辺に設けられた周辺ピクセルの差値を利用し、誤差計算部で計算された誤差のうち、符号化する範囲を決定する一実施形態を示したブロック図である。 第nピクセルのエッジを利用して計算した第nピクセルの誤差の範囲を説明するためのグラフである。 第nピクセルの周辺ピクセルの差値を利用して計算した第nピクセルの誤差の範囲を説明するためのグラフである。 臨界値を勾配にして、エッジと誤差との関係を説明するためのグラフである。 第nピクセルのエッジを説明するためのグラフである。 第nピクセルの周辺ピクセルの差値を説明するためのグラフである。 第1ないし第10ピクセルのエッジと第1ないし第10ピクセルの周辺ピクセルとの差値を示すテーブルである。 第1ないし第10ピクセルの誤差を上位ビットから下位ビット順にビットプレーン単位で表現したテーブルである。 予測部で、所定ピクセルの値を予測する一実施形態を図示した概念図である。 所定ピクセル「x」の値を予測する一実施形態について説明するために図示した概念図である。 本発明による視感特性を利用した映像符号化方法にかかわる一実施形態を示したフローチャートである。 第nピクセルのエッジを利用し、図12の第1210段階で計算された第nピクセルの誤差のうち、符号化する範囲を決定する一実施形態を示したフローチャートである。 第nピクセルの周辺に設けられた周辺ピクセルを利用し、図12の第1210段階で計算された誤差のうち、符号化する範囲を決定する一実施形態を示したフローチャートである。 第nピクセルのエッジまたは第nピクセルの周辺に設けられた周辺ピクセルの差値を利用し、図12の第1210段階で計算された誤差のうち、符号化する範囲を決定する一実施形態を示したフローチャートである。
符号の説明
100 予測部
110 誤差計算部
120 符号化範囲決定部
130 符号化部
200,400 エッジ計算部
210,410 第1臨界値計算部
220,320,440 範囲決定部
300,420 周辺差値計算部
310,430 第2臨界値計算部
500,700 第nピクセルのエッジ
510 第1臨界値に該当する誤差
520 第(n−1)ピクセルと第(n+1)ピクセルとの差値
530 第2臨界値に該当する誤差
800 第nピクセルの周辺ピクセル間の差値
810 第1エッジ
820 第2エッジ

Claims (17)

  1. 映像を構成するピクセルのうち所定ピクセルの値と前記所定ピクセルに対応する参照ピクセルの値との誤差を計算する段階と、
    前記計算された誤差のうち符号化する範囲を、視感特性上認知できる範囲を判断できる既設定の方式で決定する段階と、
    前記決定された範囲に該当する前記計算された誤差値だけ符号化する段階とを含むことを特徴とする視感特性を利用した映像符号化方法。
  2. 前記決定する段階は、
    前記所定ピクセルの値と前記所定ピクセルの周辺に設けられた周辺ピクセルの値との差値を計算する段階と、
    前記計算された差値を利用し、前記計算された誤差のうち符号化する範囲を決定する段階とを含むことを特徴とする請求項1に記載の視感特性を利用した映像符号化方法。
  3. 前記決定する段階は、
    前記計算された差値を既設定の値で除算して臨界値を計算する段階と、
    前記計算された臨界値以上に該当する前記計算された誤差値だけ表現できる上位ビット数を決定する段階とを含み、
    前記符号化する段階は、
    前記計算された誤差値のうち前記決定された上位ビット数に該当する前記計算された誤差値だけ符号化することを特徴とする請求項2に記載の視感特性を利用した映像符号化方法。
  4. 前記決定する段階は、
    前記所定ピクセルの周辺に設けられた周辺ピクセル間の差値を計算する段階と、
    前記計算された差値を利用し、前記計算された誤差のうち符号化する範囲を決定する段階とを含むことを特徴とする請求項1に記載の視感特性を利用した映像符号化方法。
  5. 前記決定する段階は、
    前記計算された差値を既設定の値で除算して臨界値を計算する段階と、
    前記計算された臨界値以上に該当する前記計算された誤差値だけ表現できる上位ビット数を決定する段階とを含み、
    前記符号化する段階は、
    前記計算された誤差値のうち前記決定された上位ビット数に該当する前記計算された誤差値だけ符号化することを特徴とする請求項4に記載の視感特性を利用した映像符号化方法。
  6. 前記決定する段階は、
    前記所定ピクセルの値と前記所定ピクセルの周辺に設けられた周辺ピクセルの値との差値、または前記周辺ピクセル間の差値を計算する段階と、
    前記計算された差値を利用し、前記計算された誤差のうち符号化する範囲を決定する段階とを含むことを特徴とする請求項1に記載の視感特性を利用した映像符号化方法。
  7. 前記決定する段階は、
    前記所定ピクセルの値と前記周辺ピクセルの値との第1差値を計算する段階と、
    前記周辺ピクセル間の第2差値を計算する段階と、
    前記第1差値を既設定の値で除算して第1臨界値を計算し、第2差値を既設定の値で除算して第2臨界値を計算する段階と、
    前記第1臨界値及び前記第2臨界値のうちさらに大きい値以上に該当する前記計算された誤差値だけ表現できる上位ビット数を決定する段階とを含み、
    前記符号化する段階は、
    前記計算された誤差値のうち前記決定された上位ビット数に該当する前記計算された誤差値だけ符号化することを特徴とする請求項6に記載の視感特性を利用した映像符号化方法。
  8. 前記決定された範囲に該当しない前記計算された誤差値は、期待値、平均値及び中間値のうちいずれか一つで復号化器で復元されることを特徴とする請求項1に記載の視感特性を利用した映像符号化方法。
  9. 映像を構成するピクセルのうち所定ピクセルの値と前記所定ピクセルに対応する参照ピクセルの値との誤差を計算する段階と、
    前記計算された誤差のうち符号化する範囲を、視感特性上認知できる範囲を判断できる既設定の方式で決定する段階と、
    前記決定された範囲に該当する前記計算された誤差値だけ符号化する段階とを含む方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
  10. 映像を構成するピクセルのうち所定ピクセルの値と前記所定ピクセルに対応する参照ピクセルの値との誤差を計算する誤差計算部と、
    前記計算された誤差のうち符号化する範囲を、視感特性上認知できる範囲を判断できる既設定の方式で決定する符号化範囲決定部と、
    前記決定された範囲に該当する前記計算された誤差値だけ符号化する符号化部とを備えることを特徴とする視感特性を利用した映像符号化装置。
  11. 前記符号化範囲決定部は、
    前記所定ピクセルの値と前記所定ピクセルの周辺に設けられた周辺ピクセルの値との差値を計算するエッジ計算部と、
    前記計算された差値を利用し、前記計算された誤差のうち符号化する範囲を決定する決定部とを備えることを特徴とする請求項10に記載の視感特性を利用した映像符号化装置。
  12. 前記範囲決定部は、
    前記計算された差値を既設定の値で除算して臨界値を計算する臨界値計算部と、
    前記計算された臨界値以上に該当する前記計算された誤差値だけ表現できる上位ビット数を決定する範囲決定部とを備え、
    前記符号化部は、
    前記計算された誤差値のうち前記決定された上位ビット数に該当する前記計算された誤差値だけ符号化することを特徴とする請求項11に記載の視感特性を利用した映像符号化装置。
  13. 前記符号化範囲決定部は、
    前記所定ピクセルの周辺に設けられた周辺ピクセル間の差値を計算する周辺差値計算部と、
    前記計算された差値を利用し、前記計算された誤差のうち符号化する範囲を決定する決定部とを備えることを特徴とする請求項10に記載の視感特性を利用した映像符号化装置。
  14. 前記決定部は、
    前記計算された差値を既設定の値で除算して臨界値を計算する臨界値計算部と、
    前記計算された臨界値以上に該当する前記計算された誤差値だけ表現できる上位ビット数を決定する範囲決定部とを備え、
    前記符号化部は、
    前記計算された誤差値のうち前記決定された上位ビット数に該当する前記計算された誤差値だけ符号化することを特徴とする請求項13に記載の視感特性を利用した映像符号化装置。
  15. 前記符号化範囲決定部は、
    前記所定ピクセルの値と前記所定ピクセルの周辺に設けられた周辺ピクセルの値との差値、または前記周辺ピクセル間の差値を計算する計算部と、
    前記計算された差値を利用し、前記計算された誤差のうち符号化する範囲を決定する決定部とを備えることを特徴とする請求項10に記載の視感特性を利用した映像符号化装置。
  16. 前記決定部は、
    前記所定ピクセルの値と前記周辺ピクセルの値との第1差値を計算するエッジ計算部と、
    前記周辺ピクセル間の第2差値を計算する周辺差値計算部と、
    前記第1差値を既設定の値で除算して第1臨界値を計算し、第2差値を既設定の値で除算して第2臨界値を計算する臨界値計算部と、
    前記第1臨界値及び前記第2臨界値のうちさらに大きい値以上に該当する前記計算された誤差値だけ表現できる上位ビット数を決定する範囲決定部とを備え、
    前記符号化部は、
    前記計算された誤差値のうち前記決定された上位ビット数に該当する前記計算された誤差値だけ符号化することを特徴とする請求項15に記載の視感特性を利用した映像符号化装置。
  17. 前記決定された範囲に該当しない前記計算された誤差値は、期待値、平均値及び中間値のうちいずれか一つで復号化器で復元されることを特徴とする請求項10に記載の視感特性を利用した映像符号化装置。
JP2008260172A 2007-10-04 2008-10-06 視感特性を利用した映像符号化装置及び方法 Expired - Fee Related JP4995171B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20070099969A KR101394151B1 (ko) 2007-10-04 2007-10-04 시감 특성을 이용한 영상 부호화 장치 및 방법
KR10-2007-0099969 2007-10-04

Publications (2)

Publication Number Publication Date
JP2009095023A true JP2009095023A (ja) 2009-04-30
JP4995171B2 JP4995171B2 (ja) 2012-08-08

Family

ID=40269469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008260172A Expired - Fee Related JP4995171B2 (ja) 2007-10-04 2008-10-06 視感特性を利用した映像符号化装置及び方法

Country Status (4)

Country Link
US (1) US8526749B2 (ja)
EP (1) EP2046051B1 (ja)
JP (1) JP4995171B2 (ja)
KR (1) KR101394151B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011525332A (ja) * 2008-06-20 2011-09-15 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 複数の歪抑制下のビデオ圧縮

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107205155B (zh) * 2017-05-24 2019-09-27 上海交通大学 基于人眼视觉在空域上融合特性的二维码隐藏画面系统
US11270468B1 (en) 2020-12-18 2022-03-08 Facebook Technologies, Llc. Joint color image and texture data compression
US11647193B2 (en) * 2020-12-18 2023-05-09 Meta Platforms Technologies, Llc Adaptive range packing compression

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006509435A (ja) * 2002-12-06 2006-03-16 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー ビデオ品質の測定
JP2006222861A (ja) * 2005-02-14 2006-08-24 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム
US20070110327A1 (en) * 2005-11-16 2007-05-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding image and method and apparatus for decoding image using human visual characteristics

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04119763A (ja) * 1990-09-11 1992-04-21 Toshiba Corp 画像処理装置
JPH07115664A (ja) 1993-10-15 1995-05-02 Mitsubishi Electric Corp 高能率符号化復号化装置
US5724097A (en) 1993-10-18 1998-03-03 Mitsubishi Denki Kabushiki Kaisha Adaptive quantization of video based on edge detection
KR0150150B1 (ko) * 1994-07-14 1998-10-15 김광호 에지 강조를 이루는 오차확산 방식 이치화 방법 및 장치
US20030012445A1 (en) 1997-05-08 2003-01-16 Nekka Matsuura Image processing system for compressing image data including binary image data and continuous tone image data by a sub-band transform method with a high-compression rate
US6295379B1 (en) * 1997-09-29 2001-09-25 Intel Corporation DPCM image compression with plural quantization table levels
JP2001520854A (ja) 1998-02-20 2001-10-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ピクチャシーケンス符号化方法及び装置
FR2792798B1 (fr) 1999-04-26 2001-05-25 Thomson Multimedia Sa Procede et dispositif de quantification pour compression video
US6931058B1 (en) * 2000-05-19 2005-08-16 Scientific-Atlanta, Inc. Method and apparatus for the compression and/or transport and/or decompression of a digital signal
EP1126693B1 (en) * 1999-10-29 2003-01-08 Ricoh Company, Ltd. Image processing method , image processing apparatus and recording medium
JP2001268565A (ja) * 2000-03-15 2001-09-28 Fuji Xerox Co Ltd 画像符号化装置および画像復号装置
US20050063596A1 (en) * 2001-11-23 2005-03-24 Yosef Yomdin Encoding of geometric modeled images
JP4443165B2 (ja) * 2003-08-20 2010-03-31 株式会社リコー 画像圧縮装置及び画像圧縮方法
EP1515278B1 (en) * 2003-09-11 2007-02-28 STMicroelectronics S.r.l. Video compression using dithering
US7454050B2 (en) * 2004-06-18 2008-11-18 Csi Technology, Inc. Method of automating a thermographic inspection process
US8442108B2 (en) 2004-07-12 2013-05-14 Microsoft Corporation Adaptive updates in motion-compensated temporal filtering
US7486834B2 (en) * 2005-01-18 2009-02-03 Lexmark International, Inc. System and method for dynamically shifting error diffusion data
US7570819B2 (en) * 2005-01-28 2009-08-04 Chih-Ta Star Sung Method and apparatus for displaying images with compression mechanism
KR100745164B1 (ko) 2005-02-22 2007-08-01 (주)애드팍테크놀러지 영상압축률 향상을 위한 밝기 연동 색차양자화 방법
JP2007020036A (ja) * 2005-07-11 2007-01-25 Toshiba Corp 画像送信装置および画像受信装置
US7702169B2 (en) * 2005-08-18 2010-04-20 Qualcomm Incorporated Systems, methods, and apparatus for table construction and use in image processing
US7847251B1 (en) * 2006-08-08 2010-12-07 Fluke Corporation System and method for creating equipment inspection routes
KR101375662B1 (ko) 2007-08-06 2014-03-18 삼성전자주식회사 이미지 데이터 압축 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006509435A (ja) * 2002-12-06 2006-03-16 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー ビデオ品質の測定
JP2006222861A (ja) * 2005-02-14 2006-08-24 Toshiba Corp 画像符号化装置、画像符号化方法および画像符号化プログラム
US20070110327A1 (en) * 2005-11-16 2007-05-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding image and method and apparatus for decoding image using human visual characteristics

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011525332A (ja) * 2008-06-20 2011-09-15 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 複数の歪抑制下のビデオ圧縮
US8594178B2 (en) 2008-06-20 2013-11-26 Dolby Laboratories Licensing Corporation Video compression under multiple distortion constraints

Also Published As

Publication number Publication date
EP2046051B1 (en) 2013-10-16
KR101394151B1 (ko) 2014-05-14
KR20090034624A (ko) 2009-04-08
EP2046051A2 (en) 2009-04-08
JP4995171B2 (ja) 2012-08-08
US8526749B2 (en) 2013-09-03
EP2046051A3 (en) 2009-12-02
US20090092324A1 (en) 2009-04-09

Similar Documents

Publication Publication Date Title
JP5048383B2 (ja) 画像データの空間上予測装置及び方法、並びにそれを利用した符号化装置及び方法、画像データの空間上予測補償装置及び方法、並びにそれを利用した復号化装置及び方法
KR20190085907A (ko) 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
JP2006332790A (ja) データ符号化装置、データ復号化装置、データ符号化方法、データ復号化方法、プログラム
JP4995171B2 (ja) 視感特性を利用した映像符号化装置及び方法
US9712828B2 (en) Foreground motion detection in compressed video data
JP2010166520A (ja) 画像符号化・復号化装置
WO2012160626A1 (ja) 画像圧縮装置、画像復元装置、及びプログラム
JP2010078965A (ja) 演算装置および方法、量子化装置および方法、並びにプログラム
KR101073938B1 (ko) 색차공간 예측을 이용한 영상부호화방법
EP3264765B1 (en) Decoding method and decoder for quantization parameter decoding for video decoding
JP2005168028A (ja) 絶対差演算装置とそれを用いた動き推定装置及び動映像符号化装置
JP4415651B2 (ja) 画像符号化装置、及び画像復号化装置
JP2003244696A (ja) 符号化処理装置、復号処理装置、および方法、並びにコンピュータ・プログラム
JP2009267726A (ja) 動画像符号化装置、録画装置、動画像符号化方法、動画像符号化プログラム
JP4271018B2 (ja) 電子透かし埋め込み方法、電子透かし検出方法及び装置並びにプログラム
Roselinkiruba et al. A novel pattern-based reversible data hiding technique for video steganography
JP2006304270A (ja) 復号化装置、逆量子化方法及びこれらのプログラム
KR20190083018A (ko) 이미지 처리 방법 및 그 시스템
Li et al. JPEG noises beyond the first compression cycle
KR20140143873A (ko) 블록특성을 이용한 적응 이미지 압축방법 및 그 시스템
JP2011114683A (ja) ブロックノイズ検出装置、ブロックノイズ検出方法、及びブロックノイズ検出プログラム
KR20200067040A (ko) 데이터 압축 장치 및 방법
JP2010093608A (ja) 画像処理システムおよび画像処理プログラム
JP2006345320A (ja) データ符号化装置、データ復号化装置、データ符号化方法、データ復号化方法、プログラム
JP2004153786A (ja) 電子透かし埋め込み装置、電子透かし検出装置及びそれらの方法並びに記録媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110920

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111220

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120509

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4995171

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees