JP2014123962A - ビデオコンテンツを圧縮するシステム及び方法 - Google Patents

ビデオコンテンツを圧縮するシステム及び方法 Download PDF

Info

Publication number
JP2014123962A
JP2014123962A JP2014015852A JP2014015852A JP2014123962A JP 2014123962 A JP2014123962 A JP 2014123962A JP 2014015852 A JP2014015852 A JP 2014015852A JP 2014015852 A JP2014015852 A JP 2014015852A JP 2014123962 A JP2014123962 A JP 2014123962A
Authority
JP
Japan
Prior art keywords
pixel
pixels
value
edge
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014015852A
Other languages
English (en)
Other versions
JP5976702B2 (ja
Inventor
Martinez Bauza Judit
ジュディット・マルティネス・バウザ
Varadarajan Srinivas
スリニバス・バラダラジャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014123962A publication Critical patent/JP2014123962A/ja
Application granted granted Critical
Publication of JP5976702B2 publication Critical patent/JP5976702B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40093Modification of content of picture, e.g. retouching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Television Systems (AREA)
  • Image Processing (AREA)

Abstract

【課題】画素値を補間する方法を提供する。
【解決手段】補間方法は見失った画素の位置を検出する1802ことを含む。更に、この方法は複数の最も接近している画素を判断1804すること、前記複数の最も接近している画素それぞれの値を判断1806すること、及び、前記見失った画素と複数の最も接近している画素との間の各距離を判断する1808ことを含んでいる。この方法は更に、前記複数の最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとしてを分類する1810ことと、前記見失った画素の値を、前記複数の最も接近している画素それぞれの値と、見失った画素と複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断する1812ことを含んでいる。
【選択図】図18

Description

関連出願に対する相互参照
本願は本願と同日に出願した同時継続中の米国特許出願第12/511,329号(名称:映像コンテンツを圧縮するシステム及び方法(SYSTEM AND METHOD OF COMPRESSING VIDEO CONTENT))を参考として含む。
無線リンクを使用して、外部ディスプレイあるいはプロジェクターが携帯装置に接続される場合、無線チャンネルを介してデータを転送しなければならない。チャンネルの容量がデータ転送を扱うには十分に大きくない場合、ソース(つまり生ビデオ)は圧縮され得る。容量は、無線リンクの物理層の技術的制約(例えば、チャンネルが最大限使用されるのを妨げる干渉)により十分に大きくないことがある。チャンネルが他の装置と共有される場合、容量は更に十分ではなくなることがある。あるいは、チャンネル帯域幅の一部がエラー緩和又は修正のために確保される場合、容量は十分に大きくないことがある。現在の圧縮方法は様々な制限を有している。
したがって、必要なものはビデオコンテンツを圧縮する改良されたシステム及び方法である。
複数の図において、様々な図面全体にわたって、特に説明がない限り同様な参照番号は同様な要素を参照する。
無線システムを示す図。 電話を示す図。 グラフィックコンテンツを圧縮する方法を示すフローチャートであり、また無線リンクによる送信用のビデオコンテンツが示される。 画像エッジを検知する方法を示すフローチャート。 選択的に画像コーナを改良する方法の第1の局面を例示するフローチャート。 選択的に画像コーナを改良する方法の第2の局面を例示するフローチャート。 パターンマッチングの方法を例示するフローチャート。 テキストブロックコーナを例示する図形。 ランレングス符号化の方法を例示するフローチャート。 画像中点を得る方法を例示するフローチャート。 中点を改良する方法を例示するフローチャート。 複数の画素を例示する図。 中点を回復する方法を例示するフローチャート。 相互エッジ/相互中点予測の方法を例示するフローチャート。 複数の画素を例示する図。 水平及び垂直の中点をエンコードする方法を例示するフローチャート。 送信されていない画素の内部エッジ/内部中点予測の方法を例示するフローチャート。 画素値を補間する方法の第1の局面を例示するフローチャート。 画素値を補間する方法の第2の局面を例示するフローチャート。 複数の画素を示す。
画素値を補間する方法が開示され、この方法は、見失った画素の位置を検出すること、複数の最も接近している画素を判断すること、前記複数の最も接近している画素それぞれの値を判断すること、前記見失った画素と前記複数の最も接近している画素それぞれの間の距離を判断すること、前記最も接近している画素それぞれを、エッジ画素か非エッジ画素のいずれかに分類すること、前記見失った画素の値を、前記最も接近している複数の画素それぞれの値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断することを含む。
特定の局面において、前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む。前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含む。更に、垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含む。垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った前記第4の画素は第4の分類を含む。
この局面において、前記方法は更に、前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定すること、前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定すること、前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定すること、及び第4の分類がエッジ画素あるいは非エッジ画素である場合に、0または1に等しい第4のマスクを設定することを具備する。又前記方法は、垂直の予測値を判断することを更に含み、前記垂直の予測値はVert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここでVert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、及びaは第1の距離である。更に前記方法は、水平の予測値を判断することを更に含み、前記水平の予測値はHorz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、ここで、Horz_Predは垂直の予測値、LCは第3のマスク、Cは第3の値、dは第4の距離、LDは第4のマスク、Dは第4の値、及びcは第3の距離である。前記方法は又、前記見失った画素の補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断することを更に含み、ここで、Vert_Predは前記垂直の予測値、Horz_Predは前記水平の予測値である。
更にこの局面において、前記非エッジ画素は中点画素である。前記中点画素は、基本層(baselayer)ビットストリーム、上位層(enhancementlayer)ビットストリームあるいはそれらの組み合わせから得られる。前記最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれる。
他の局面において、見失った画素の位置を検出する手段と、複数の最も接近している画素を判断する手段と、複数最も接近している画素それぞれの値を判断する手段と、前記見失った画素と前記複数の最も接近している画素との間の各距離を判断する手段と、前記最も接近している画素のそれぞれを、エッジ画素あるいは非エッジ画素のいずれかに分類する手段と、前記見失った画素の値を、前記複数最も接近している画素の各値、前記見失った画素と前記複数最も接近している画素との間の各距離、及び前記複数最も接近している画素の各分類に少なくとも部分的に基づいて判断する手段を含むデコーダ装置が開示される。
この局面において、前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む。前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含む。更に、垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った第2の画素は第2の値を含み、水平軸に沿った第3の画素は第3の値を含み、及び水平軸に沿った第4の画素は第4の値を含む。垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った第2の画素は第2の分類を含み、水平軸に沿った第3の画素は第3の分類を含み、及び水平軸に沿った第4の画素は第4の分類を含む。
このデコーダ装置は又、前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定する手段と、前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定する手段と、前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定する手段と、及び前記第4の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第4のマスクを設定する手段を更に具備する。更にこのデコーダ装置は、垂直の予測値を判断する手段を更に含み、前記垂直の予測値はVert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここで、Vert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、及びaは第1の距離である。前記デコーダ装置は、水平の予測値を判断する手段を更に含み、ここで、水平の予測値はHorz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、ここでHorz_Predは垂直の予測値、LCは第3のマスク、Cは第3の値、dは第4の距離、LDは第4のマスク、Dは第4の値、及びcは第3の距離である。前記デコーダ装置は又、前記見失った画素に対する補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断する手段を更に含み、ここで、Vert_Predは垂直の予測値、及びHorz_Predは水平の予測値である。
この局面において、前記非エッジ画素は中点画素である。前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらの設定み合わせから得られる。更に、前記複数の最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれる。
更に他の局面において、プロセッサを含む装置が開示される。前記プロセッサは、見失った画素の位置を検出し、複数の最も接近している画素を判断し、前記複数の最も接近している画素それぞれの値を判断し、前記見失った画素と前記複数最も接近している画素との間の各距離を判断し、複数最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとしてを分類し、及び前記見失った画素の値を、前記複数最も接近している画素の各値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断するように動作する。
この局面において、前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む。前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含む。更に、垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含む。垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った第4の画素は第4の分類を含む。
前記プロセッサは更に、前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定し、前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定し、前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定し、及び前記第4の分類がエッジ画素あるいは非エッジ画素である場合は、0または1に等しい第4のマスクを設定する。前記プロセッサは更に、垂直の予測値を判断し、前記垂直の予測値は、Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここで、Vert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、aは第1の距離である。前記プロセッサは更に、水平の予測値を判断し、前記水平の予測値は、Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、ここで、Horz_Predは前記垂直の予測値、LCは前記第3のマスク、Cは前記第3の値、dは前記第4の距離、LDは前記第4のマスク、Dは前記第4の値、及びcは前記第3の距離である。前記プロセッサは更に、前記見失った画素に対する補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断し、ここで、Vert_Predは前記垂直の予測値、及びHorz_Predは前記水平の予測値である。
この局面において、前記非エッジ画素は中点画素である。前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらを設定み合わせから得られる。更に、前記複数の最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれる。
他の局面において、コンピュータ可読媒体を具備するコンピュータ・プログラム製品が開示される。前記コンピュータ可読媒体は、見失った画素の位置を検出するための少なくとも1つの命令、複数の最も接近している画素を判断するための少なくとも1つの命令、前記複数の最も接近している画素それぞれの値を判断するための少なくとも1つの命令、前記見失った画素と前記複数の最も接近している画素との間の各距離を判断するための少なくとも1つの命令、前記複数の各々の最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとして分類するための少なくとも1つの命令、及び前記見失った画素の値を、前記複数最も接近している画素それぞれの値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断するための少なくとも1つの命令を含む。
この局面において、前記複数の最も接近している画素は垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む。前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離、及び水平軸に沿った第4の距離を含む。更に、垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含む。垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った前記第4の画素は第4の分類を含む。
前記コンピュータ可読媒体は、前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定するための少なくとも1つの命令と、前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定するための少なくとも1つの命令と、前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定するための少なくとも1つの命令と、及び前記第4の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第4のマスクを設定するための少なくとも1つの命令とを含む。前記コンピュータ可読媒体は更に、Verrt_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断される垂直の予測値を判断するための少なくとも1つの命令を含み、ここで、Vert_Predは前記垂直の予測値、LAは前記第1のマスク、Aは前記第1の値、bは前記第2の距離、LBは前記第2のマスク、Bは前記第2の値、及びaは前記第1の距離である。又、前記コンピュータ可読媒体は、Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断される水平の予測値を判断するための少なくとも1つの命令を含み、ここで、Horz_Predは前記垂直の予測値、LCは前記第3のマスク、Cは前記第3の値、dは前記第4の距離、LDは前記第4のマスク、Dは前記第4の値、及びcは前記第3の距離である。更に、前記コンピュータ可読媒体は、前記見失った画素の補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断するための少なくとも1つの命令を含み、ここで、Vert_Predは前記垂直の予測値、Horz_Predは前記水平の予測値である。
この局面において、前記非エッジ画素は中点画素である。前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらを設定み合わせから得られる。更に、前記複数の最も接近している画素の値それぞれが、輝度値、色濃度値、コントラス値あるいは勾配値から成るグループから選ばれる。
さらに他の局面において、選択的に画像コーナを改良する方法が開示され、この方法は、画像の領域の走査すること、テキストを含んでいるか非テキスト含んでいるかで領域を分類すること、テキスト含んでいる領域内のあらゆる見失ったコーナを識別すること、及びエッジマップに前記見失ったコーナを加えることを含む。更にこの方法は、画像内のオーバーラップしている画素のブロックを得ること、及び前記ブロック中の画素のヒストグラム(HistN)をプロットすること、を更に含み、前記ヒストグラムは複数のビンを含み、各ビンは1つの画素強度に相当する。又この方法は、背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断することを更に含み、ここで、Max(HistN)は前記ヒストグラム中の画素の最大数であり、Tot_Blk_Pixは画素の前記ブロック中の画素数の合計値である。この方法は、前記ヒストグラムに基づいて、成分(NC)の数をNC=Sum(HistN>Th1)を使用して判断することを更に含み、ここでNCは第1の閾値Th1を超過した画素数である。更に前記方法は、BPRが第2の閾値Th2より大きいか否か判断すること、NCが前記第3の閾値Th3未満か否か判断すること、及びBPRがTh2より大きく、NCがTh3未満の場合、テキストを含んでいる領域として前記画素のブロックを分類することを具備する。
この局面において前記方法は、前記テキストを含んでいる領域上でパターンマッチングを行なうことを更に具備する。又前記方法は、非エッジ画素の位置を検出すること、少なくとも1つのコーナ位置の非エッジ画素を計算に入れること、前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出すること、及び前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の垂直方向画素の位置を検出することを更に具備する。前記方法は、前記複数の水平方向画素及び前記複数の垂直方向画素の何れかがエッジ画素か否か判断すること、及び前記複数の水平方向画素及び前記複数の垂直方向画素の何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けるすることを更に具備する。前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる。
他の局面においては装置が開示され、この装置は画像の領域を走査する手段と、テキストを含んでいるか非テキスト含んでいるかで、領域を分類する手段と、テキスト含んでいる領域内のあらゆる見失ったコーナを識別する手段と、及びエッジマップに見失ったコーナを加える手段とを含む。更に前記装置は、前記画像内のオーバーラップする画素のブロックを得る手段と、及び前記ブロック中の画素のヒストグラム(HistN)をプロットする手段とを含み、前記ヒストグラムは複数のビンを含み、各ビンは1画素の強度に相当する。前記装置は又、背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断する手段を更に含み、ここで、Max(HistN)はヒストグラム中の画素の最大数、Tot_Blk_Pixは画素の前記ブロック中の画素合計値である。前記装置は、成分(NC)の数をNC=Sum(HistN>Th1)を使用して判断する手段を更に含み、ここで、NCはヒストグラムに基づく第1の閾値Th1を超過した画素の数である。更に前記装置は、BPRが第2の閾値Th2より大きいか否か判断する手段と、NCが第3の閾値Th3未満か否か判断する手段、及びBPRがTh2より大きく、NCがTh3未満である場合、画素の前記ブロックをテキスト含んでいる領域として分類する手段とを更に具備する。
この局面において前記装置は、前記テキスト含んでいる領域上でパターンマッチングを行なう手段を更に具備する。又、前記装置は、非エッジ画素の位置を検出する手段と、少なくとも1つのコーナ位置の非エッジ画素を計算に入れる手段と、少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出する手段、及び少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の垂直方向画素の位置を検出する手段とを更に具備する。前記装置は、前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断する手段、及び前記複数の水平方向画素の何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けする手段を更に具備する。前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる。
又、他の局面において、プロセッサを具備する装置が開示され、前記プロセッサは、画像の領域を走査し、テキストを含んでいるか非テキスト含んでいるかで、前記領域を分類し、テキストを含んでいる領域内のあらゆる見失ったコーナを識別し、及びエッジマップに前記見失ったコーナを追加するよう動作する。又、前記プロセッサは、前記画像内のオーバーラップしている画素のブロックを得て、及び前記ブロック内画素のヒストグラム(HistN)をプロットし、前記ヒストグラムは複数のビンを含み、各ビンは1つの画素強度に対応する。更に、前記プロセッサは、背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断し、ここで、Max(HistN)は前記ヒストグラム中の画素の最大数であり、Tot_Blk_Pixは画素ブロック中の画素数の合計である。前記プロセッサは、成分数(NC)をNC=Sum(HistN>Th1)を使用して判断し、ここでNCは、ヒストグラムに基づく第1の閾値Th1を超過する画素の数である。又、前記プロセッサは、BPRが第2の閾値Th2より大きいか否か判断し、NCが第3の閾値Th3未満か否か判断し、及びBPRがTh2より大きく、NCがTh3未満である場合、前記画素ブロックをテキスト含んでいる領域として分類する。
この局面において、前記プロセッサは、前記テキスト含んでいる領域上でパターンマッチングを行う。前記プロセッサは、非エッジ画素の位置を検出し、少なくとも1つのコーナ位置の非エッジ画素を考慮し、前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の水平方向画素の位置を検出し、及び前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の垂直方向画素の位置を検出する。又、前記プロセッサは、前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断し、及び前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けする。前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる。
更に他の局面において、コンピュータ可読媒体を具備するコンピュータ・プログラム製品が開示される。前記コンピュータ可読媒体は、画像領域を走査するための少なくとも1つの命令と、前記領域をテキストを含んでいるか非テキスト含んでいるかで分類するための少なくとも1つの命令と、テキスト含んでいる領域内のあらゆる見失ったコーナを識別するための少なくとも1つの命令、及びエッジマップに前記見失ったコーナを追加するための少なくとも1つの命令とを具備する。更に、前記コンピュータ可読媒体は、前記画像内のオーバーラップしている画素ブロックを得るための少なくとも1つの命令、及び前記ブロック内画素のヒストグラム(HistN)をプロットするための少なくとも1つの命令を具備し、ここで前記ヒストグラムは、複数のビンを含み、各ビンは1つの画素強度に対応する。前記コンピュータ可読媒体は更に、背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断するための少なくとも1つの命令を更に具備し、ここで前記Max(HistN)は、前記ヒストグラム中の画素の最大数であ、Tot_Blk_Pixは、前記画素ブロック中画素の画素数の合計である。前記コンピュータ可読媒体は、成分の数(NC)をNC=Sum(HistN>Th1)を使用して判断するための少なくとも1つの命令を具備し、ここでNCは、ヒストグラムに基づく第1の閾値Th1を超過する画素の数である。更に前記コンピュータ可読媒体は、BPRが第2の閾値Th2より大きいか否か判断するための少なくとも1つの命令と、NCが第3の閾値Th3未満か否か判断するための少なくとも1つの命令、及びBPRがTh2より大きく、NCがTh3未満である場合、前記画素のブロックをテキスト含んでいる領域として分類するための少なくとも1つの命令とを具備する。
この局面において、前記コンピュータ可読媒体は更に、前記テキスト含んでいる領域上でパターンマッチングを行なうための少なくとも1つの命令を具備する。又、前記コンピュータ可読媒体は、非エッジ画素の位置を検出するための少なくとも1つの命令と、少なくとも1つのコーナ位置の前記非エッジ画素を計算に入れるための少なくとも1つの命令と、前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の水平方向画素の位置を検出するための少なくとも1つの命令、及び前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出するための少なくとも1つの命令とを具備する。前記コンピュータ可読媒体は、前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断するための少なくとも1つの命令、及び前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けするための少なくとも1つの命令と、を具備する。前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる。
他の局面において、相互エッジ/相互中点予測方法が開示され、この方法は、以前のフレームデータを受信すること、探索半径を1に等しく初期化すること、以前のフレームデータ中の共通位置の点周辺を前記探索半径を使用して走査すること、及び基準点が検出されたか否か判断することを具備する。前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含む。又、前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む。
この局面において、前記方法は、前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定することを具備する。更に前記方法は、前記基準点が検出されたない場合、前記探索半径を1だけ増加させ、及び前記探索半径が最大の範囲に等しいか否か判断することを更に具備する。前記方法は又、前記探索半径が前記最大の範囲と等しくない場合、前記以前のフレームデータ中の共通位置の点周辺を前記探索半径を使用して走査すること、基準点が検出されるか否か判断すること、及び前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定することを更に具備する。前記方法は、前記探索半径が前記最大の範囲と等しい場合、所定初期値と等しい相互予測値を設定すること、を更に具備する。前記所定初期値は、フレームデータの値の範囲における中央の値である。
他の局面においては装置が開示され、この装置は、以前のフレームデータを受信する手段と、探索半径を1に等しく初期化する手段と、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査する手段、及び基準点が検出されたか否か判断する手段とを具備する。前記以前のフレームデータ及び前記基準点は、少なくとも1つの中点を含む。又、前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む。
この局面において、前記装置は、前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する手段を具備する。更に前記装置は、前記基準点が検出されない場合、前記探索半径を1だ増加させる手段、及び前記探索半径が最大範囲に等しいか否か判断する手段とを具備する。前記装置は又、前記探索半径が前記最大の範囲に等しくない場合、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査する手段と、基準点が検出されたか否か判断する手段、及び前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する手段とを更に具備する。前記装置は、前記探索半径が最大の範囲に等しい場合、所定初期値に等しい相互予測値を設定する手段を具備する。前記所定初期値はフレームデータの一連の値内の中央の値である。
更に他の局面において、プロセッサを含む装置が開示される。前記プロセッサは、以前のフレームデータを受信する受信し、探索半径を1に等しく初期化し、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査し、及び基準点が検出されたか否か判断するよう動作する。前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含む。更に、前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む。
この局面において、前記プロセッサは、前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する。前記プロセッサは更に、前記基準点が検出されない場合、前記探索半径を1だけ増加させ、及び前記探索半径が最大の範囲に等しいか否か判断する。更に前記プロセッサは、前記探索半径が最大の範囲に等しくない場合、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査し、基準点が検出されたか否か判断し、及び前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する。前記プロセッサは更に、前記探索半径が最大の範囲に等しい場合、所定初期値に等しい相互予測値を設定する。前記所定初期値はフレームデータの値の範囲内の中央の値である。
他の局面によれば、コンピュータ可読媒体を具備するコンピュータ・プログラム製品が開示される。前記コンピュータ可読媒体は、以前のフレームデータを受信するための少なくとも1つの命令と、探索半径を1に等しく初期化するための少なくとも1つの命令と、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査するための少なくとも1つの命令、及び基準点が検出されたか否か判断するための少なくとも1つの命令を具備する。前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含む。又、前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む。
この局面において、前記コンピュータ可読媒体は、前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定するための少なくとも1つの命令を具備する。更に、前記コンピュータ可読媒体は、前記基準点が検出されない場合、前記探索半径を1だけ増加させるための少なくとも1つの命令、及び前記探索半径が最大範囲に等しいか否か判断するための少なくとも1つの命令を具備する。前記コンピュータ可読媒体は更に、前記探索半径が最大の範囲に等しくないとき、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査するための少なくとも1つの命令と、基準点が検出されたか否か判断するための少なくとも1つの命令、及び前記基準点が検出されない場合、前記基準点の値に等しい相互予測値を設定するための少なくとも1つの命令、を具備する。前記コンピュータ可読媒体は更に、探索半径は最大の範囲と等しい場合、所定初期値と等しい相互予測値を設定するための少なくとも1つの命令を具備する。前記所定初期値はフレームデータの値における中央の値である。
更に他の局面において、内部エッジ/内部中点予測方法が開示され、この方法は、複数の送信された画素を判断すること、画像を、複数の所定サイズの画素ブロックに分割すること、及び各画素ブロック内のいずれかの画素が、前記複数の送信された画素内にあるか判断することを具備する。前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含む。前記所定サイズは最後の反復中のスケールファクタに等しく設定される。
この局面において、前記方法は、前記画素ブロック内画素の何れも前記複数の送信された画素内にない場合、所定初期値と等しい予測値を設定することを更に具備する。前記方法は又、前記画素ブロック内の送信された全ての画素値の平均に等しい予測値を設定することを更に具備する。更に前記方法は、送信されていない画素の残余部を判断することを更に具備する。前記送信されていない画素の残余部は、実際値から予測値を引いた値を含む。
他の局面においては装置が開示され、この装置は、複数の送信された画素を判断する手段と、画像を所定サイズの複数の画素ブロックに分割する手段、及び各ブロック内のいずれかの画素が、前記複数の送信された画素内の画素か否か判断する手段とを具備する。前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含む。前記所定サイズは最後の反復におけるスケールファクタと等しく設定される。
この局面において前記装置は、前記画素ブロック内画素の何れも前記複数の送信された画素内にない場合、所定初期値に等しい予測値を設定する手段を更に具備する。前記装置は又、前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定する手段を更に具備する。更に前記装置は、送付されていない画素の残余部を判断する手段を具備する。前記送付されていない画素の残余部は実際値から予測値を引いた値を含む。
更に他の局面において、プロセッサを具備する装置が開示される。前記プロセッサは、複数の送信された画素を判断し、画像を所定サイズの複数の画素ブロックに分割し、及び各画素ブロック内の何れかの画素が、前記複数の送信された画素内にあるか判断するよう動作する。前記複数の送信された画素は複数のエッジ画素及び複数の中点画素を含む。前記所定サイズは、最後の反復におけるスケールファクタと等しく設定される。
この局面において、前記プロセッサは、前記画素ブロック内の画素の何れも前記複数の送信された画素内にない場合、所定初期値に等しい予測値を設定する。前記プロセッサは更に、前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定することを具備する。更に前記プロセッサは、送付されていない画素の残余部を判断することを具備する。前記送付されていない画素の残余部は、実際値から予測値を引いた値を含む。
他の局面において、コンピュータ可読媒体を含むコンピュータ・プログラム製品が開示される。前記コンピュータ可読媒体は、複数の送信された画素を判断するための少なくとも1つの命令と、画像を所定サイズの複数の画素ブロックに分割するための少なくとも1つの命令、及び各画素ブロック内のいずれかの画素が、複数の送信された画素内にあるか否か判断するための少なくとも1つの命令を具備する。前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含む。前記所定サイズは、最後の反復におけるスケールファクタに等しく設定される。
この局面において、前記コンピュータ可読媒体は、前記画素ブロック内画素のいずれも複数の送信された画素内にない場合、所定初期値と等しい予測値を設定するための少なくとも1つの命令を具備する。コンピュータ可読媒体は又、前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定するための少なくとも1つの命令を具備する。更に前記コンピュータ可読媒体は、送付されていない画素の残余部を判断するための少なくとも1つの命令を具備する。前記送付されていない画素の残余部は実際値から予測値を引いた値を含む。
他の局面において、中点を改良する方法が開示され、この方法は、複数の中点を受信すること、前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査すること、現在の画素位置が最大の走査距離より大きいか否か判断すること、及び前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断することを具備する。前記方法は又、前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断すること、及び前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除することを更に具備する。前記所定数の方向は8方向を含む。前記所定ステップ角は45度である。
更に他の局面においては装置が開示され、この装置は、複数の中点を受信する手段と、前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査する手段と、現在の画素位置が最大の走査距離より大きいか否か判断する手段、及び前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断する手段を具備する。前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断する手段と、前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除する手段とを更に具備する。前記所定数の方向は8方向を含む。前記所定ステップ角は45度である。
更に他の局面においては、プロセッサを含む装置が開示される。前記プロセッサは、複数の中点を受信し、前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査し、現在の画素位置が最大の走査距離より大きいか否か判断し、及び前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断するよう動作する。更に前記プロセッサは、前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断し、及び前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除する。前記所定数の方向は8方向を含む。前記所定ステップ角は45度である。
更に他の局面において、コンピュータ可読媒体を具備するコンピュータ・プログラム製品が開示される。前記コンピュータ可読媒体は、複数の中点を受信するための少なくとも1つの命令と、前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査するための少なくとも1つの命令と、現在の画素位置が最大の走査距離より大きいか否か判断するための少なくとも1つの命令、及び前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断するための少なくとも1つの命令、を具備する。前記コンピュータ可読媒体は又、前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断するための少なくとも1つの命令、及び前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除するための少なくとも1つの命令を具備する。前記所定数の方向は8方向を含む。前記所定ステップ角は45度である。
用語「典型的(exemplary)」は、「一例、例え又は実例として役立つ」ことを意味するためにここに使用される。ここに記述されるいずれの局面も「典型的な」は、必ずしも他の局面に関して好適あるいは有利に解釈される必要がない。
本明細書において、用語「アプリケーション」は、目的コード、スクリプト、バイトコード、マークアップ言語ファイル及びパッチのような実行可能なコンテンツを有するファイルを含む。更に、ここに引用される「アプリケーション」は、開かれる必要があるドキュメント、あるいはアクセスされる必要のある他のデータ・ファイルのように、本来実行可能ではないファイルを含んでいる。
用語「コンテンツ」は、目的コード、スクリプト、バイトコード、マークアップ言語ファイル及びパッチのような実行可能なコンテンツを有するファイルを含んでいる。更に、ここに引用される何れの「コンテンツ」も、開かれる必要があるドキュメント、あるいはアクセスされる必要のある他のデータ・ファイルのような本来実行可能でないファイルを含んでいる。
本明細書において用語「通信装置」、「無線装置」、「無線電話」、「無線通信装置」及び「無線送受話器」は、交換可能に使用されている。第3世代(3G)無線技術の到来で、更なる帯域幅能力の向上により、更なる無線能力を備えた電子装置が可能となった。したがって無線装置は、携帯電話、ページャ(pager)、PDA、スマートフォン、ナビゲーション装置あるいは無線接続機能を備えたコンピューターであり得る。
先ず図1を参照すると、無線携帯デジタル表示インターフェース(WMDDI)システムが示され、これは一般に100として示されている。図示のように、WMDDIシステム100はホスト装置102及びクライアント装置104を含んでいる。ホスト装置102及びクライアント装置104は無線リンク106によって接続される。特定の局面では、ホスト装置は、セルラー電話、移行電話、携帯データアシスタント(PDA)あるいは他の携帯型の無線装置のようなモバイル装置であり得る。更に、クライアント装置104は、オーディオ/ビデオ・デコーディング、HIDあるいはその組み合わせのような、埋め込み式の無線ディスプレイであり得る。例えば、クライアント装置104は、外部ディスプレイ、プロジェクター又は他の同様な装置である。無線リンク106はWMDDIであり得る。
特定の局面では、ホスト装置102及びクライアント装置104は、WMDDIプロトコルを使用して、マルチメディア・コンテンツ及びコントロール・メッセージを交換するための関係及び安全なコミュニケーションを設立することができる。1つの局面では、大量のデータが前方リンク中、つまりホスト装置102からクライアント装置104への交換となり得るという意味で、コミュニケーションは非対称のことがある。
特定の局面では、ホスト装置102は、マルチメディア・コンテンツを提供するいくつかのアプリケーションを含んでいる。例えば、ホスト装置102は、ファイルから圧縮したビデオ・オーディオ・ビットストリームを解読するメディア・プレイヤーを含んでいる。ホスト装置102は、更にグラフィックのコマンドを処理して、映像コンテンツを与える1つ以上のビデオゲームを含んでいる。更にホスト装置102は、カメラ(例えば電荷結合装置(CCD)カメラ、相補性金属酸化膜半導体(CMOS)カメラ、または撮影した赤/緑/青(RGB)画像を流すために使用される他のカメラ)を含む。これらのアプリケーション、及び画像コンテンツを生成する他のアプリケーションは、ホスト装置102上の内蔵ディスプレイに、生ビデオ(例えばRGB、Cr/Cb/Y)を、内蔵ディスプレイの解像度及びビット深度に一致する解像度及びビット深度で供給する。内部ディスプレイは液晶ディスプレイ(LCD)あるいは他のディスプレイである。生ビデオコンテンツ(例えばRGB)のためのビット・レートは、共通のディスプレイ解像度及びフレームレートで以下のテーブル1に示されている。
表1 共通表示解像度及びフレームレートに対するRGBビットレート
無線リンク106を使用して、クライアント装置104がホスト装置102に接続されるとき、ホスト装置102からクライアント装置104に転送されるデータは、無線チャンネルを通って転送される。無線チャンネルの容量が十分に大きくない場合、生ビデオデータが圧縮され得る。無線チャンネルの容量は、無線チャンネルの物理層の技術的な制約により、無線チャンネルが他の装置と共有されていることにより、エラー緩和技術あるいは修正技術のためにチャンネルの幾らかのマージンが確保されていることにより、あるいはそれら組み合わせにより、十分ではない場合がある。
無線リンク106は固定容量を提供しない場合がある。従って、無線リンク106によるビデオ送信は可変チャンネル条件に適応可能である。
図2を参照すると、無線電話器の典型的で限定しない局面が示され、それは一般に220と示されている。図示されるように、無線装置220は、デジタル信号プロセサ224及びそれに接続されたアナログ信号プロセッサー226を含むオンチップ・システム222を含んでいる。図2に示されるように、ディスプレイ・コントローラ228及びタッチスクリーン・コントローラ230が、デジタル信号プロセサ224に接続されている。そして、オンチップ・システム222外部のタッチスクリーン・ディスプレイ232が、ディスプレイコントローラ228及びタッチスクリーン・コントローラ230に接続される。
図2は更に、ビデオエンコーダ234(例えば位相交互ライン(PAL)エンコーダ、連続カプラ・メモリ(SECAM)エンコーダ、または全国テレビ放送システム委員会(NTSC)エンコーダ)がデジタル信号プロセサ224に接続されている。更に、ビデオ増幅器236がビデオエンコーダ234及びタッチスクリーン・ディスプレイ232に接続される。更にビデオポート238がビデオ増幅器236に接続される。図2に示すように、ユニバーサル・シリアル・バス(USB)コントローラ240がデジタル信号プロセサ224に接続される。更に、USBポート242がUSBコントローラ240に接続される。メモリ244及び加入者識別モジュール(SIM)カード246も、デジタル信号プロセサ224に接続され得る。更に図2に示るように、ディジタル・カメラ248がデジタル信号プロセサ224に接続され得る。典型的な局面では、ディジタル・カメラ248は、電荷結合素子(CCD)カメラあるいは相補性金属酸化膜半導体(CMOS)カメラである。
更に図2に示されるように、ステレオ・オーディオコーデック(CODEC)250がアナログ信号プロセッサー226に接続され得る。更に、オーディオ・アンプ252がステレオ・オーディオコーデック 250に接続され得る。典型的な局面では、第1ステレオ・スピーカー254及び第2ステレオ・スピーカー256が、オーディオ・アンプ252に接続される。図2は、マイクアンプ258もステレオ・オーディオコーデック 250に接続される得ることを示している。更に、マイク260がマイクアンプ258に接続され得る。特定の局面では、周波数変調(FM)ラジオ・チューナー262がステレオ・オーディオコーデック 250に接続され得る。更に、FMアンテナ264がFMラジオ・チューナー262に接続される。更に、ステレオヘッドアンプ266がステレオ・オーディオコーデック250に接続され得る。
図2は更に、無線周波数(RF)トランシーバ268がアナログ信号プロセッサー226に接続され得ることを示す。RFスイッチ270はRFトランシーバ268及びRFアンテナ272に接続され得る。図2に示されるように、キーパッド274がアナログ信号プロセッサー226に接続され得る。更に、マイク276を備えたモノ・ヘッドフォンがアナログ信号プロセッサー226に接続され得る。更にバイブレータ装置278がアナログ信号プロセッサー226に接続され得る。図2は更に、電源280がオンチップ・システム222に接続され得ることを示す。特定の局面では、電源280は直流(DC)電源で、電力を必要とする無線装置220の様々なコンポーネントに電力を供給する。更に、特定の局面では、電源は再充電可能なDCバッテリあるいはAC電源に接続される交流AC・DC変換器から得られる。
図2に示されるように、タッチスクリーン・ディスプレイ232、ビデオポート238、USBポート242、カメラ248、第1ステレオ・スピーカー254、第2ステレオ・スピーカ256、マイクロホン260、FMアンテナ264、ステレオヘッドフォン266、RFスイッチ270、RFアンテナ272、キーパッド274、モノ・ヘッドフォン276、バイブレータ278及び電源280は、オンチップ・システム222の外部にある。
特定の局面では、ここに記述される1つ以上の方法は、メモリ244に格納されるコンピュータ・プログラム命令として、ここに記述された方法を行なうためのプロセッサー224及び226によって実行され得る。更にプロセッサー224、226、メモリ244、メモリ244に格納された命令、あるいはそれらを組み合わせたものは、ここに記述される方法の1つ以上を行なうための手段として機能する。
次に図3を参照すると、無線リンクによる送信のために、グラフィックコンテンツ及びビデオコンテンツを圧縮する方法が示され、それは一般に300として示される。方法はブロック302で始まり、エッジ検出が複数の画素304について、少なくとも部分的にガウス・シグマ値(Gauss Sigma value)306、エッジ値308の割合、及び低い閾値と高い閾値の比310に基づいて行なわれる。ブロック312では、選択的なコーナ改良(corner refinement)が、画素304について、ブロック302で作成されたエッジマップ(edge-map)314上で行なわれる。ブロック317へ移行し、ランレングス(run length)符号化が、ブロック308で作成された改良されたエッジマップ316上で行なわれる。その後ブロック318では、ランレングス符号化されたデータについて、符号化演算が行なわれる。特定の局面では、改良されたエッジマップ316は、後述される使用のために、現在のフレームデータ(CFD)バッファ320に格納される。
ブロック322へ進み、中点が改良されたエッジマップ316から得られ、中点マップ324が作成される。その後、中点マップ324内の中点は、少なくとも部分的に、改良されたエッジマップ316に基づいて、ブロック326で改良される。ブロック328では、エッジ値330が改良されたエッジマップ316から得られる。エッジ値はCFDバッファ320に格納される。
ブロック332へ移行し、改良されたエッジマップ316、中点マップ324、画素304、及びブロック326で作成され改良された中点マップ334に基づいて、中点が回復される。ブロック336では相互予測(inter prediction)が、画素304及びバッファPFD 338から受信した以前のフレームデータ(PFD)について行なわれる。相互予測方法の結果は、エッジ残余部340及び中点残余部342を含み、エッジ残余部340及び中点残余部342について、ブロック318の符号化演算が行なわれる。相互予測は多数のフレームについて行なわれる。
ブロック344では、水平及び垂直の中点が、中点マップ324、改良されたエッジマップ316、画素304あるいはそれらの組み合わせに基づいてエンコードされる。水平及び垂直の中点符号化は、複数回の反復にて行なわれる。この符号化ステップの結果は、中点残余部346を含み、及びブロック318において符号化演算が中点残余部346に対して行なわれる。更に、中点マップ348はCFDバッファ320に出力され得る。
ブロック350に移行し、送信されていない画素の内部予測(intra prediction)が、少なくとも部分的に画素304、CFDバッファ320内の現在のフレームデータ、中点マップ348、エッジマップ314、又はそれらの組み合わせに基づいて行なわれる。内部予測が行なわれた後、符号化は無損失であると考えられる。内部予測の結果は無損失な画素残余部を含み、この画素残余部に基づいて、符号化演算がブロック318で行なわれる。図示されるように、図3に示される方法の出力はビットストリーム354であり得る。
図4は、画像エッジを検知する方法を示し、この方法は一般に400で示される。この方法はブロック402で始まり、エンコーダがガウスシグマ記号404を使用して、ガウスマスク(Gaussian mask)を構築する。ブロック406では、エンコーダが複数の画素408を使用して、画像を滑らかにする。ブロック410に移行し、エンコーダは水平の勾配、垂直の勾配及び勾配の大きさ(MG)を計算する。
ブロック412では、エンコーダがMGのヒストグラムをプロットし、エッジ414の割合に少なくとも部分的に基づいて、高い閾値(「高Th」)を得る。その後、ブロック416では、エンコーダが低い閾値(「低Th」)を判断する。エンコーダは、低Th/高Tnに等しい閾値比418に基づいて、低Thを判断する。ブロック420では、エンコーダが最大ではない抑制(non-maximal suppression)を行なう。ブロック422にてエンコーダはヒステリシス閾値化(thresholding)を行なう。その後ブロック424にてエンコーダはエッジマップを出力する。
図5は、選択的に画像のコーナを改良する方法の第1の局面を例示する。方法はブロック502で始まり、領域がスキャンされる。ブロック504では、領域はテキストを含んでいる領域と非テキスト含んでいる領域に分類される。判断506では、領域がテキストを含んでいるか非テキストを含んでいるか否か判断される。領域がテキストを含んでいる場合、方法500はブロック508に進み、テキストを含んでいる領域内の見失ったコーナ(missing corners)が識別される。その後、ブロック510では、見失ったコーナがエッジマップに加えられる。
判断ブロック512に移り、他の領域が走査に利用可能か否か判断される。利用可能であれば方法500は、ここに記述されるようにブロック502に戻り、上記のように継続される。他の領域が走査に利用可能でなければ方法500は、ブロック514に移行し、改良されたエッジマップが送信される。その後、方法500は終了する。判断ブロック506に返り、領域が非テキストであった場合、方法500は判断ブロック512に直接進み、ここに記述されるように継続する。
次に図6を参照すると、選択的にコーナを改良する方法の第2の局面が示され、この方法は一般に600と示される。方法はブロック602で始まり、エンコーダは画素604のオーバーラップしているブロックを得る。画像の各フレームは画素の正方形ブロックに分割され得る。各正方形のサイズは、基準寸法(Basic_Size)足す(plus)2倍のパターンマッチング・ブロック・サイズ(Pattern_Matching_Block_Size)に等しい大きさを持っている。言いかえれば、各正方形の大きさは次式を使用して決定され得る:

Side=Basic_Size+2*Pattern_Matching_Block_Size

更に、パターンマッチング・ブロック・サイズの画素の境界は、画素の隣接するブロックでオーバーラップし得る。
ブロック606にてエンコーダは、ブロック内画素のヒストグラム(HistN)を得て、そしてヒストグラム中の各ビン(bin)が1つの画素強度に相当するように、ヒストグラムをプロットする。ブロック608では、背景画素比(BPR)が次式を使用して決定され得る。

BPR=Max(HistN)/Tot_Blk_Pix
ここで、Max(HistN)=ヒストグラム中の画素の最大数
Tot_Blk_Pix=画素ブロック中の画素数の合計数

ブロック608では、成分数(NC)が次式を使用して決定され得る。

NC=Sum(HistN>Th1)

成分数は、ヒストグラムに基づいて、その出現が第1の閾値(Th1)を超過する画素の数を表わす。
判断ステップ610に移り、エンコーダはBPRが第2の閾値(Th2)より大きいか、及びNCが第3の閾値Th3未満か否か判断する。そうであるならば、画素のブロックはテキストブロックとして分類され、方法600はブロック612に進み、エッジマップ614の全ての非エッジ画素について、パターンマッチングが行なわれる。またブロック612にて、検出された全ての合致について、新らたなエッジがエッジマップに挿入され、改良されたエッジマップを作成する。ブロック616で、エンコーダは改良されたエッジマップを出力する。その後、方法600は終了する。判断ブロック610に返り、条件が満たされない場合、画素ブロックは非テキストブロックとして分類され、方法600は終了する。特定の局面では、第2の閾値Th2及び第3の閾値Th3はヒストグラムに基づくプリセット値である。
図7は、一般に700で示されるパターンマッチングの方法を例示するフローチャートである。図8はテキストブロックのコーナを例示する図で、この図は図7に示される方法700の説明において引用されるものである。
この方法はブロック702で始まり、テキストブロック中の各非エッジ画素Pについて、以下のステップが実行される。ブロック704で、Pはあたかもそれがコーナ位置、例えば左上コーナ、右上コーナ、左下コーナあるいは右下コーナにあるかのように考えられる(計算に取り込まれる)。ブロック706では、最も近い3つの水平方向画素の位置が検出される。ブロック708では、最も近い3つの垂直方向画素の位置が検出される。特定の局面では、3つは選択されたパターンマッチングブロックサイズ(Pattern_Matching_Block_Size)である。
判断ブロック710に移り、エンコーダは最も近い3つの水平画素のうちのいずれか、及び最も近い3つの垂直画素のうちいずれかがエッジか否か判断する。そうであれば、方法700はブロック712に移り、当該画素Pはエッジとしてラベル付けされる。その後、判断ブロック714で、エンコーダは他の画素がパターンマッチングに利用可能か否か判断する。そうであれば、方法700はブロック704に戻り、ここに記述されたように処理を続ける。そうでなければ、方法700は終了する。
判断ステップ710に返り、最も近い6画素のどれもエッジでない場合、方法700は判断ブロック716に移行し、エンコーダは、画素Pが全てのコーナでテストされたか判断する。そうでなければ、方法700はブロック718に進み、画素Pは次のコーナ位置に移行される。画素Pが全てのコーナ位置でテストされた場合、方法700はここに記述されるように判断ブロック714に続き、ここに記述されたように継続する。
特定の局面では、図6、図7の中に示される方法600、700は、テキストを含んでいる領域内に見失ったコーナを含ませることにより、エッジマップを改良するために使用され得る。これらの方法600及び700は、テキストを含んでいるか非テキスト含んでいるかで、領域を局部的に分類し得る。これは輝度の局部的ヒストグラムに基づいて判断され得る。方法600の判断は、輝度ヒストグラム中の所定閾値(つまりTh1、Th2、Th3)に基づく。更に方法600及び700は、見失ったコーナを含むテキストを含む領域内のエリアを選択する。これらのエリアは最初のエッジマップ上のパターンマッチングを使用して選択され得る。選択されたエリアについて、見失ったコーナがエッジマップに加えられる。
複数の知られたエッジ検出は、画像傾斜が、水平あるいは垂直方向に明らかに方向づけられていないところで、画像テキスト部のコーナ検出に失敗する。多くのエッジ画素が発見されず、1つの領域からの中点が他の領域中の補間に使用されるようにし、そして筋状の人工物となる。図6及び図7に結びついて記述されたコーナ改良方法は、パターンマッチングを使用して、検出されないエッジ(例えばコーナ)の位置を予測し、エッジマップに新たなエッジを導入する。これは多数の新たなエッジに結びつき、非テキスト領域のより高いビット・レートを導入するので、予備処理ステップ(ステップ602−510)は、フレームをテキスト領域か非テキスト領域のブロックに分類するために含まれ得る。そして、コーナの改良は、画像のテキスト領域について選択的に適用される。
図6及び図7に示される方法600及び700は、同様のビット・レート送信に対して、およそ5〜8デシベル(5−8dB)だけ画素信号対雑音比(PSNR)を改善する。更に、これらの方法600及び700は、単純なパターンマッチングを利用するので、計算上比較的安価であり、このパターンマッチングはビットワイズ(bit-wise)演算子を使用して最適化され得る。精巧な勾配計算法、例えばハリス・コーナ検出(Harris Corner Detector)の必要性がなくなる。
図9は、一般に900と示されるランレングス符号化の方法を例示する。特定の局面で方法900は、エンコーダへ入力される改良されたエッジマップ902上で実行される。更に方法900は、ランレングス符号化を行なう上で、1以上の画素位置904を利用する。
方法はブロック906で始まり、エンコーダは、改良されたエッジマップ902を、次のエッジが検出されるまでラスター・スキャンする。エッジまでの画素計数値が「Run」として記録される。判断ステップ908では、エンコーダが、Runの値がMax_Run値より大きいか否か判断する。そうでなければ、Runの値は符号化演算用の入力バッファに格納される。その後、方法900は終了する。判断ステップ908に返り、Run値がMax_Run値より大きい場合、Max_Run値は入力バッファに「N」回に格納される。ここで、N=ceil(Run/Max_Run)、ceil()はN<=Run/Max_Runのように最大の整数をとり、Run=Run%Max_Runとして得られる値が続く。その後、方法900は終了する。
図10を参照すると、フレーム内の画像中点を得る方法が示され、この方法は一般に1000として示される。図10の方法1000は、複数の行1004及び複数の列1006を有する改良されたエッジマップ1002に基づき、エンコーダによって行なわれる。方法1000は各行1004及び各列1006に基づいて行なわれる。
方法はブロック1008で始まり、エンコーダは現在位置Curr_Posから、現在行Curr_Rowに沿って、エッジ、中点、または境界が新たな位置New_Posで検出されるまで走査する。ブロック1010では、中点が、現在位置プラス新たな位置を2で割った位置、つまり中点=(Curr_Pos+New_Pos)/2として定義される。更にブロック1010では、現在位置は新たな位置に等しく設定される(つまりCurr_Pos=New_Pos)。ブロック1012では、複数の水平方向中点が出力される。
ブロック1014で、エンコーダは現在位置(Curr_Pos)から現在の列Curr_Colに沿って、エッジ、中点、または境界が新たな位置(New_Pos)で検出されるまで走査する。ブロック1016では、中点が新たなポジション足す現在位置を2で割った位置、つまり中点=(Curr_Pos+New_Pos)/2として定義される。更にブロック1016で、現在位置は新たなポジションに等しく設定される(つまり、Curr_Pos=New_Pos)。ブロック1018では、複数の垂直方向の中点が出力される。その後、方法1000は終了する。
図11は、中点を改良する方法を示し、一般に1100で示される。方法1100は複数の中点1102、及び複数の中点位置1104を使用して行なわれる。この方法はブロック1106で始まり、図12に示すように、エンコーダは各中点から45度ステップで8つの方向に走査し、及び各方向でMax_Scan_Distance位置の最大値に対して走査する。
判断ステップ1108に移行し、エンコーダは現在の画素位置がMax_Scan_Distanceより大きいか否か判断する。そうならば、方法1100は判断ステップ1110に移行し、エンコーダは8つの方向全てが走査されたか否か判断する。そうでなければ、方法1100はブロック1112に進み、エンコーダは次の他の走査方向に移行する。その後方法1100はブロック1106に戻り、ここに記述されたように継続する。
判断ステップ1110に返り、8つの方向が全て走査されると、方法1100は判断ステップ1114に移り、エンコーダは最後の中点が走査されたか否か判断する。そうでなければ、方法1100はブロック1116に進み、エンコーダは次の中点へ移行する。その後、方法1100はブロック1106に戻り、ここに記述されたように継続する。そうでなければ、判断ステップ1114で、エンコーダが最後の中点の周りを走査した場合、方法1100はブロック1118に進み、エンコーダは複数の改良された中点を出力する。その後、方法1100は終了する。
判断ステップ1108に返り、現在の画素位置がMax_Scan_Distanceより大きくない場合、方法は判断ステップ1120に進み、エンコーダは、現在の画素がエッジか否か判断する。そうならば、方法1100は判断ステップ1110に返り、ここに記述されたように継続する。現在の中点がエッジでない場合、方法1100は1122に進み、エンコーダは、現在の画素が中点か否か判断する。そうでなければ、方法1100はブロック1124に進み、エンコーダは走査方向の次の画素に移る。判断ステップ1122で、現在の画素が中点である場合、方法1100はブロック1126に進み、現在の中点は中点マップから削除される。図11のように、全ての中点が処理された後、複数の改良された中点1112が出力され、方法1100は終了する。
図11に示される方法1100は、図12を参照して更に説明される。中点つまり走査中心から始り、5X5のブロックの中で中点のまわりの近隣画素は、45度ステップで、図12に示される8ラインの各々に沿って走査される。エッジ画素に遭遇するか、又はブロックの終了に到達するまで、近隣の中点は削除され得る。図12に示される例において、画素M0は走査中心として作用し得る。また、中点MI、M2及びM4は改良の結果削除される。画素M5及びM6は、それらがエッジを横切り、それらの値が画素M0の値と著しく異なるので削除されない。
特定の局面では、図11に示される方法1100は最初の反復においてエンコードされる中点の量を、再構成の質を著しく低下させることなく減らすために使用され得る。方法1100は、さらなる反復が画像フレームに更なる詳細を加え、画像フレーム内に更によい品質をもたらす計量可能な符号化法の一部と考えられる。更に方法1100は、同じビット・レートの他の方法より実質的によい画質を提供する。
フレームデータの符号化中に、水平方向あるいは垂直方向の2つのエッジ間の中心にある画素は、中点としてエンコードされる。画像中のエッジの性質により、画像中の多数の均一領域が、高密度な中点を含み得る。追加の中点(つまりサンプル)は不要であり、画質における著しい改良とはならないことがある。図11に示される方法1100は、不必要な中点を削除し、そのような中点の符号化を防ぐために使用され得る。線形予測が、以前の反復においてエンコードされた垂直及び水平方向の2つのエッジごとの間の中点の存在を仮定し得るので、削除された中点は、近隣の中点から回復される必要がある。これらの中点はランドマーク点と考えられ、これらのランドマーク点が回復される必要がある。
図13は、一般に1300として示される中点を回復する方法を示す。図13の方法1300は改良されたエッジマップ1302、複数の画素1304、中点マップ1306、改良された中点マップ1308あるいはそれの組み合わせを使用して行なわれる。
方法はブロック1310で始まり、1組のランドマーク点が、改良された1組の中点の一部ではなく、1組の中点の一部である中点によって決定される。つまり、{Landmark Pts}={Midpoints} − {Refined Midpoints}。ブロック1312で、エンコーダは各中点から45度(45°)ステップで8方向に走査する。判断1314でエンコーダは、現在の画素がランドマーク点か否か判断する。そうならば、方法1300は1316に進み、エンコーダは現在の画素を中点の値で満たす。その後、方法1300は終了し、回復された中点マップが出力され得る。
判断1314に返り、現在の画素がランドマーク点でない場合、方法1300は判断1318に移行する。判断1318でエンコーダは、現在の画素がエッジか否か判断する。そうでなければ方法1300は、ブロック1312に戻り、ここに記述されたように継続する。そうでなければ方法1300は終了し、回復された中点マップが出力され得る。
図13に記述された方法1300を使用して、ランドマーク点(つまり削除された中点)の位置が最初に計算される。その後、それらの位置での値は、走査センター(例えば図12の画素M0)である中点の値で満たされる。デコーダはこれらの画素を持っていないので、水平及び垂直方向それぞれ2つのエッジごとに、その間に中点があることを確実にしておくことは有用である。ランドマーク画素、又はランドマーク点が予測変量として作用し得るので、それらはエンコーダとデコーダで同一であるべきである。従って、図13に示される回復方法1300は、エンコーダ及びデコーダで行なわれる。
図11及び図13に示される方法1100及び1300は、不要な中点を削除することにより、画質の著しい損失を受けることなく、データ転送速度を減少させるために使用できる。これらの方法1100及び1300はエッジ情報で置き換え、オブジェクトの境界を横切る中点を保存することができる。更に、方法1100及び1300は比較的単純であり、エンコーダ(方法1100)での削除、及びデコーダ(1200)での回復は、同じ走査手順に従う。
図14を参照すると、相互エッジ/相互中点(inter-edge/inter-midpoint)予測の方法を示すフローチャートが表され、この方法は一般に1400として明示される。方法1400は複数のフレームについて行なわれ、一度に1フレーム数である。更に方法1400は、前のフレームデータ(PFD)1402、複数の画素1404(例えばエッジ画素、中点画素、それらの組み合わせ)を利用する。明瞭にするため、図15は、図14に示される方法1400の説明中に引用される。
方法はブロック1406で始まり、探索半径rは1の値を持っているものとして初期化される。ブロック1408でエンコーダは、半径r付近の前のフレーム中の共通位置の点周辺を走査する。より具体的に、走査は中央の画素(つまり図15中の画素1)のまわりの正方形の領域で行なわれる。最初の反復中に、走査は画素2から画素8まで行なわれる。
判断ステップ1410でエンコーダは、基準点RefPtが最初の走査反復中に検出されたか否か判断する。そうであれば、方法1400はブロック1412に移行し、相互予測値は基準点の値に等しく設定される。その後、方法1400は終了する。判断ステップ1410で基準点が見つからない場合、方法1400はブロック1414に移行し、探索半径rの値が1ユニット(例えば1画素)増加される。
その後、判断ステップ1416でエンコーダは、探索半径rが最大値MaxRangeより大きいか否か判断する。rがMaxRangeより大きくない場合、方法1400はブロック1408に返り、ここに記述されたように継続する。そうでなく、rがMaxRangeより大きい場合、方法1400はブロック1418に移行し、エンコーダは相互予測値を所定初期値に等しく設定する。特定の局面では、所定初期値は、値の範囲内の中央の値に等しい。例えば所定初期は、データフレームの値の範囲が0と255の間にある場合、128でよい。その後、方法1400は終了する。
図14に結びついて説明された方法1400は、エッジと中点の両方に使用できる。方法がエッジ値を予測するために使用される場合、RefPtはエッジマップから与えられる位置に対応する。方法1400が中点値を予測するために使用される場合、RefPtは中点マップから与えられる位置に相当する。
図16は、1600として示される水平及び垂直の中点をエンコードする方法を示す。方法1600は現在のフレームデータ(CFD)1602及び画素1604について行なわれる。CFD1602は中点マップ及びエッジマップを含む。方法はブロック1606で始まり、水平方向中点の位置が得られる。更にブロック1608では、垂直方向中点の位置が得られる。ブロック1610では、隣接中点値が得られる。更にブロック1612では、線形の内部エッジ(intra-edge)/内部中点(intra-midpoint)の予測が行なわれる。その後、中点残余部が出力され、方法1600は終了する。
次に図17を参照すると、一般に1700として示される内部エッジ/内部中点の予測方法が示される。図17に示される方法1700は、エッジマップ1702及び中点マップ1704について行なわれる。方法はブロック1706で始まり、送られた画素の組{SentPix}が、エッジ画素の位置{EdgeLocs}及び中点画素位置{MidPtLocs}の統合によって決定される。言いかえれば、{SentPix}={EdgeLocs}+{MidPtLocs}。
ブロック1708ではフレーム画像が、最後の反復(SFLI)中のスケールファクタ(scale factor)に基づいた大きさを持っているブロックに分割される。例えば、SFLIが2と等しい場合、フレーム画像は、ブロック(2×2)画素に分割される。判断ステップ1710に移行し、エンコーダは、画像画素のブロック内画素の少なくとも1つが、SentPixのうちの1つか否か判断する。そうでなければ、方法1700はブロック1712に進み、予測値は所定初期値に等しく設定される。特定の局面では、所定初期値は128に等しい。そうでなく、画像画素のブロック内の画素のうちの1つがSentPixのうちの1つである場合、方法1700はブロック1714に移行し、予測値はブロック内画素の平均値に等しく設定される。
ブロック1716では、送信されていない画素の残余部は、ブロック1712あるいはブロック1714で決定された、実際値から予測値を引いた値と決定される。その後、無損失の画素残余部1718が出力され、方法1700は終了する。
特定の局面では、エッジに基づくビデオコーデック(video codec)が、フレーム内のエッジ及び中点をエンコードする。エッジに基づくビデオコーデックは、反復の数が増加するとともに次第に多くなる中点(サンプル)のエンコードにより、拡大縮小可能な(scalable)符号化を達成する。最後の反復の後、オリジナルのフレーム画素の部分集合はエンコードされずに残り得る。エンコードされていない画素は、無損失な品質を達成するために「無損失符号化パス(lossless encoding pass)」でエンコードされ得る。図17に記述される方法1700は、エンコードされたエッジ及び中点の局部平均に基づく、予測符号化技術を提供する。方法1700は、以前にエンコードされた画素、例えばエッジ画素、中点画素あるいはその組み合わせの位置を示すビットマップを使用する。水平又は垂直方向のエッジ対のそれぞれの間の最小距離を判断し、それらの間の中点を決定するために、スケールファクタが使用される。
図18は、画素値を補間する方法の第1の局面を例示し、この方法は一般に1800として示される。方法はブロック1802で始まり、見失った画素の位置がデコーダによって検出される。ブロック1804では、デコーダが複数の最も接近している画素を判断する。更にブロック1806では、デコーダは複数の最も接近している画素それぞれについて、値(例えば輝度値)を判断する。ブロック1808にてデコーダは、複数の最も接近している画素各々への距離を判断する。ブロック1810にてデコーダは、複数の最も接近している画素各々を、エッジ画素あるいは非エッジ画素として分類する。その後、ブロック1812にてデコーダは、複数の最も接近している画素各々の値、複数の最も接近している画素各々への距離及び複数の最も接近している画素各々の分類に基づいて、見失った画素の値を決定する。その後、方法1800は終了する。
図19を参照すると、画素値を補間する方法の別の局面が示され、この方法は一般に1900として示されている。図20は、図19に概説された方法の検討において引用される画素の実例である。
方法はブロック1902で始まり、見失った画素Pの位置がデコーダによって検出される。ブロック1904にてデコーダは、2つの最も接近している垂直方向画素A及びBの位置を検出する。最も接近しているこれら垂直画素は、垂直軸に沿った第1画素及び垂直軸に沿った第2画素を含み得る。更に、ブロック1906にてデコーダは、2つの最も接近している水平画素C及びDの位置を検出する。これら最も接近している水平画素は、水平軸に沿った第1画素、水平軸に沿った第2画素を含み得る。ブロック1908にてデコーダは、最も接近している画素各々の値(例えば色濃度値)を判断する。この値はA、B、C及びDとして示されている。ブロック1910で、Pから各々最も接近している画素までの距離がデコーダによって判断される。その距離はa、b、c及びdとして表わされる。図20に示されるように、aは画素Aまでの距離、bは画素Bまでの距離、cは画素Cまでの距離、dは画素Dまでの距離である。
判断ブロック1912に移行し、デコーダは特定画素、A、B、C又はDが、エッジまたは中点か判断する。特定画素がエッジである場合、方法1900はブロック1914に進み、デコーダが0に等しい特定画素について、マスクLを設定する。一方、特定画素が中点である場合、方法1900はブロック1916に移行し、デコーダは1と等しい特定画素について、マスクLを設定する。ブロック1914あるいはブロック1916から、方法1900はブロック1918に移行する。
ブロック1918にてデコーダは、垂直予測値Vert_Predを決定する。垂直予測値は例えば次式を使用して決定される。
Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)
ここで、
LA=画素Aのマスク、
A=画素Aの値、
b=画素Bまでの距離、
LB=画素Bのマスク、
B=画素Bの値及び、
a=画素Aまでの距離。
ブロック1920へ移行し、デコーダは水平の予測値Horz_Predを決定する。水平の予測値は次式を使用して決定され得る。
Horz_Pred=(LC*C*d+Ld*D*c)/(LD*c+LC*d)
ここで、
LC=画素Cのマスク、
C=画素Cの値、
d=画素Dまでの距離、
LD=画素Dのマスク、
D=画素Dの値及びd=画素Dまでの距離。
ブロック1922にてデコーダは、Pの補間値を垂直予測値及び水平予測値から決定する。Pの補間値は次式から決定され得る。
補間された値P=(Vert_Pred+Horz_Pred)/2
ここで、
Vert_Pred=ブロック1918で決定された垂直予測及び、
Horz_Pred=ブロック1920で決定した水平予測。
特定の局面では、図19に結びついて説明された方法1900は、見失った画素の値を、4つの最も接近している画素(水平の2つ及び垂直の2つ)の値、4つの最も接近している画素位置(距離)及び最も接近している利用可能な画素(エッジまたは中点)の分類を用いて予測(あるいは補間)する。最も接近している画素がエッジである場合、その画素は補間処理に使用されない。最も接近している画素が中点である場合、その画素は見失った画素の値を補間するために、距離・重み要因を適用して使用される。
図19に結びついて説明された方法1900は比較的単純であり、従って方法1900は計算上安価な方法となる。なぜならば、この方法は単に線形演算子のみを使用するからである。しかしながら方法1900は、追加の計算コストにより、より優れた性能の高次方程式に拡張できる。更に、エッジではなく中点のみが補間処理に使用されるので、方法1900は、補間された画素値の実際値とは著しく異なるエッジを横切るサンプルが、予測処理に用いられないことを保証する。更に、重み付けされた予測は、様々な基準点の貢献を変える際に役立つ。重みづけされた予測は、上から下へ又は左から右へ滑らかな推移を有する領域で非常に有効となり得る。
ここに記述された方法は、記述された順番で実行される必要がないことは理解されるべきである。更に、「次の」、「その後」「そして」などの言葉は、ステップの順序を制限するようには意図されていない。これらの言葉は方法の詳細な説明を通じて読者を案内するために単に使用されている。
ここに記述した構成、システム及び方法は、補間を使用して、利用可能な画素から1つ以上の見失った画素を回復するために使用できるアルゴリズムを提供する。更に、このシステムと方法は、選択的なコーナの改良を提供する。テキストを含む領域が識別され、その後、テキスト内のコーナが検知され、エッジマップに加えられる。更に、ここに示されたシステムと方法は、フレーム間予測方法及び内部フレーム予測方法を提供する。システムと方法は更に、中点の密度を減少し、ランドマーク点を回復する方法を提供する。水平又は垂直方向の2つのエッジ間の中心にある画素は、中点としてエンコードされる。しかしながら、画像中のエッジの性質により、画像中の多数の均一な領域は、高密度な中点を含み得る。どんな追加の中点も、それらは画質の著しい改良に結びつかないので、送信されたビットストリームから減少され得る。
1つ以上の典型的な局面において、説明された機能は、ハードウェア、ソフトウェア、ファームウェアあるいはそれらの任意の組み合わせの中で実施され得る。ソフトウェアで実施される場合、機能は1つ以上の命令又はコードとして、コンピュータ可読媒体に格納あるいは送信され得る。コンピュータ可読媒体は、コンピュータ記憶メディア及びある場所から別の場所へコンピュータ・プログラムの転送を支援するあらゆる媒体を含む通信媒体を含み得る。記憶媒体は、コンピューターによりアクセスできる任意の利用可能なメディアであり得る。制限ではなく例として、そのようなコンピュータ可読媒体は、RAM、ROM、EEPROM、CD−ROMまたは他の光ディスク記憶装置、磁気ディスク記憶装置あるいは他の磁気記憶装置、あるいは所望のプログラムコードを命令又はデータ構成の形式で伝送又は格納する際に用いることができる他の媒体を含み得る。又、どんな接続もコンピュータ可読媒体ということができる。例えば、ソフトウェアがウェブサイト又は遠隔源から同軸ケーブル、光ファイバケーブル、撚り対線、デジタル加入者線(DSL)あるいは赤外線、ラジオ及びマイクロ波のような無線技術を使用して送信される場合、同軸ケーブル、光ファイバケーブル、撚り対線、DSLあるいは赤外線、無線及びマイクロ波のようなワイヤレス技術は、媒体の定義の中に含まれる。ここに使用されたディスクは、コンパクト・ディスク(CD)、レーザーディスク(登録商標)、光ディスク、ディジタル・バーサタイル・ディスク(DVD)、フロッピー(登録商標)ディスク及びブルーレイ・ディスクを含んでおり、ここで、ディスク(disks)は通常磁気的にデータを再生し、その一方でディスク(discs)はレーザーでデータを光学的に再生するものである。上記のものの組み合わせもコンピュータ可読媒体の範囲内に含まれるべきである。
選択された局面が例示され、詳細に記述されたが、以下のクレームによって定義されるような、本発明の趣旨及び範囲から外れることなく、様々な代替え及び変更をすることができることは理解されるべきである。
選択された局面が例示され、詳細に記述されたが、以下のクレームによって定義されるような、本発明の趣旨及び範囲から外れることなく、様々な代替え及び変更をすることができることは理解されるべきである。
なお、以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]画素値を補間する方法であって、
見失った画素の位置を検出すること、
複数の最も接近している画素を判断すること、
前記複数の最も接近している画素それぞれの値を判断すること、
前記見失った画素と前記複数の最も接近している画素それぞれの間の距離を判断すること、
前記最も接近している画素それぞれを、エッジ画素か非エッジ画素のいずれかに分類すること、
前記見失った画素の値を、前記最も接近している複数の画素それぞれの値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断すること、
を含む方法。
[C2]前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含むC1の方法。
[C3]前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含むC2の方法。
[C4]垂直軸に沿った前記第1の画素は第1の値を含み、
垂直軸に沿った前記第2の画素は第2の値を含み、
水平軸に沿った前記第3の画素は第3の値を含み、及び
水平軸に沿った前記第4の画素は第4の値を含むC3の方法。
[C5]垂直軸に沿った前記第1の画素は第1の分類を含み、
垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った前記第4の画素は第4の分類を含むC4の方法。
[C6]前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定すること、
前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定すること、
前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定すること、及び
第4の分類がエッジ画素あるいは非エッジ画素である場合に、0または1に等しい第4のマスクを設定すること、
を更に具備するC5の方法。
[C7]垂直の予測値を判断することを更に含み、
前記垂直の予測値はVert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここでVert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、及びaは第1の距離であるC6の方法。
[C8]水平の予測値を判断することを更に含み、前記水平の予測値はHorz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、
ここで、Horz_Predは垂直の予測値、LCは第3のマスク、Cは第3の値、dは第4の距離、LDは第4のマスク、Dは第4の値、及びcは第3の距離であるC7の方法。
[C9]前記見失った画素の補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断することを更に含み、
ここで、Vert_Predは前記垂直の予測値、Horz_Predは前記水平の予測値であるC8の方法。
[C10]前記非エッジ画素は中点画素であるC1の方法。
[C11]前記中点画素は、基本層(base layer)ビットストリーム、上位層(enhancement layer)ビットストリームあるいはそれらの組み合わせから得られるC10の方法。
[C12]前記最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれるC1の方法。
[C13]見失った画素の位置を検出する手段と、
複数の最も接近している画素を判断する手段と、
複数最も接近している画素それぞれの値を判断する手段と、
前記見失った画素と前記複数の最も接近している画素との間の各距離を判断する手段と、
前記最も接近している画素のそれぞれを、エッジ画素あるいは非エッジ画素のいずれかに分類する手段と、
前記見失った画素の値を、前記複数最も接近している画素の各値、前記見失った画素と前記複数最も接近している画素との間の各距離、及び前記複数最も接近している画素の各分類に少なくとも部分的に基づいて判断する手段を含むデコーダ装置。
[C14]前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含むC13のデコーダ装置。
[C15]前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含むC14のデコーダ装置。
[C16]垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った第2の画素は第2の値を含み、水平軸に沿った第3の画素は第3の値を含み、及び水平軸に沿った第4の画素は第4の値を含むC15のデコーダ装置。
[C17]垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った第2の画素は第2の分類を含み、水平軸に沿った第3の画素は第3の分類を含み、及び水平軸に沿った第4の画素は第4の分類を含むC16のデコーダ装置。
[C18]前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定する手段と、
前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定する手段と、
前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定する手段と、及び
前記第4の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第4のマスクを設定する手段、を更に具備するC17のデコーダ装置。
[C19]垂直の予測値を判断する手段を更に含み、
前記垂直の予測値はVert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここで、Vert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、及びaは第1の距離である+B1062C18のデコーダ装置。
[C20]水平の予測値を判断する手段を更に含み、
ここで、水平の予測値はHorz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、ここでHorz_Predは垂直の予測値、LCは第3のマスク、Cは第3の値、dは第4の距離、LDは第4のマスク、Dは第4の値、及びcは第3の距離である+B1065C19のデコーダ装置。
[C21]前記見失った画素に対する補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断する手段を更に含み、
ここで、Vert_Predは垂直の予測値、及びHorz_Predは水平の予測値であるC20のデコーダ装置。
[C22]前記非エッジ画素は中点画素であるC13のデコーダ装置。
[C23]前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらの設定み合わせから得られるC22のデコーダ装置。
[C24]前記複数の最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれるC13のデコーダ装置。
[C25]プロセッサを含む装置であって、前記プロセッサは、
見失った画素の位置を検出し、
複数の最も接近している画素を判断し、
前記複数の最も接近している画素それぞれの値を判断し、
前記見失った画素と前記複数最も接近している画素との間の各距離を判断し、
複数最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとしてを分類し、及び
前記見失った画素の値を、前記複数最も接近している画素の各値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断する、
ように動作する装置。
[C26]前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含むC25の装置。
[C27]前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含むC26の装置。
[C28]垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含むC27の装置。
[C29]垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った第4の画素は第4の分類を含むC28の装置。
[C30]プロセッサは更に、
前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定し、
前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定し、
前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定し、及び
前記第4の分類がエッジ画素あるいは非エッジ画素である場合は、0または1に等しい第4のマスクを設定するC29の装置。
[C31]プロセッサは更に、
垂直の予測値を判断し、前記垂直の予測値は、Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、
ここで、Vert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、aは第1の距離であるC30の装置。
[C32]プロセッサは更に、
水平の予測値を判断し、前記水平の予測値は、Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、
ここで、Horz_Predは前記垂直の予測値、LCは前記第3のマスク、Cは前記第3の値、dは前記第4の距離、LDは前記第4のマスク、Dは前記第4の値、及びcは前記第3の距離であるC31の装置。
[C33]プロセッサは更に、
前記見失った画素に対する補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断し、
ここで、Vert_Predは前記垂直の予測値、及びHorz_Predは前記水平の予測値であるC32の装置。
[C34]前記非エッジ画素は中点画素であるC25の装置。
[C35]前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらを設定み合わせから得られるC34の装置。
[C36]前記複数の最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれるC25の装置。
[C37]コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
前記コンピュータ可読媒体は、
見失った画素の位置を検出するための少なくとも1つの命令、
複数の最も接近している画素を判断するための少なくとも1つの命令、
前記複数の最も接近している画素それぞれの値を判断するための少なくとも1つの命令、
前記見失った画素と前記複数の最も接近している画素との間の各距離を判断するための少なくとも1つの命令、
前記複数の各々の最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとして分類するための少なくとも1つの命令、及び
前記見失った画素の値を、前記複数最も接近している画素それぞれの値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断するための少なくとも1つの命令、
を含むコンピュータ・プログラム製品。
[C38]前記複数の最も接近している画素は垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含むC37のコンピュータ・プログラム製品。
[C39]前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離、及び水平軸に沿った第4の距離を含むC38のコンピュータ・プログラム製品。
[C40]垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含むC39のコンピュータ・プログラム製品。
[C41]垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った前記第4の画素は第4の分類を含むC40のコンピュータ・プログラム製品。
[C42]前記コンピュータ可読媒体は、
前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定するための少なくとも1つの命令と、
前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定するための少なくとも1つの命令と、
前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定するための少なくとも1つの命令と、及び
前記第4の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第4のマスクを設定するための少なくとも1つの命令とを含む、C41のコンピュータ・プログラム製品。
[C43]前記コンピュータ可読媒体は更に、
Verrt_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断される垂直の予測値を判断するための少なくとも1つの命令を含み、
ここで、Vert_Predは前記垂直の予測値、LAは前記第1のマスク、Aは前記第1の値、bは前記第2の距離、LBは前記第2のマスク、Bは前記第2の値、及びaは前記第1の距離であるC42のコンピュータ・プログラム製品。
[C44]前記コンピュータ可読媒体は更に、
Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断される水平の予測値を判断するための少なくとも1つの命令を含み、
ここで、Horz_Predは前記垂直の予測値、LCは前記第3のマスク、Cは前記第3の値、dは前記第4の距離、LDは前記第4のマスク、Dは前記第4の値、及びcは前記第3の距離であるC43のコンピュータ・プログラム製品。
[C45]前記コンピュータ可読媒体は更に、
前記見失った画素の補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断するための少なくとも1つの命令を含み、
ここで、Vert_Predは前記垂直の予測値、Horz_Predは前記水平の予測値であるC44のコンピュータ・プログラム製品。
[C46]前記非エッジ画素は中点画素であるC37のコンピュータ・プログラム製品。
[C47]前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらを設定み合わせから得られるC46のコンピュータ・プログラム製品。
[C48]前記複数の最も接近している画素の値それぞれが、輝度値、色濃度値、コントラス値あるいは勾配値から成るグループから選ばれるC37のコンピュータ・プログラム製品。
[C49]選択的に画像コーナを改良する方法であって、
画像の領域の走査すること、
テキストを含んでいるか非テキスト含んでいるかで領域を分類すること、
テキスト含んでいる領域内のあらゆる見失ったコーナを識別すること、及び
エッジマップに前記見失ったコーナを加えること、
を含む方法。
[C50]画像内のオーバーラップしている画素のブロックを得ること、及び
前記ブロック中の画素のヒストグラム(HistN)をプロットすること、を更に含み、
前記ヒストグラムは複数のビンを含み、各ビンは1つの画素強度に相当するC49の方法。
[C51]背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断することを更に含み、
ここで、Max(HistN)は前記ヒストグラム中の画素の最大数であり、Tot_Blk_Pixは画素の前記ブロック中の画素数の合計値であるC50の方法。
[C52]前記ヒストグラムに基づいて、成分(NC)の数をNC=Sum(HistN>Th1)を使用して判断することを更に含み、ここでNCは第1の閾値Th1を超過した画素数であるC51の方法。
[C53]BPRが第2の閾値Th2より大きいか否か判断すること、
NCが前記第3の閾値Th3未満か否か判断すること、及び
BPRがTh2より大きく、NCがTh3未満の場合、テキストを含んでいる領域として前記画素のブロックを分類すること、
を更に具備するC52の方法。
[C54]前記テキストを含んでいる領域上でパターンマッチングを行なうことを更に具備するC53の方法。
[C55]非エッジ画素の位置を検出すること、
少なくとも1つのコーナ位置の非エッジ画素を計算に入れること、
前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出すること、及び
前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の垂直方向画素の位置を検出すること、
を更に具備するC54の方法。
[C56]前記複数の水平方向画素及び前記複数の垂直方向画素の何れかがエッジ画素か否か判断すること、及び
前記複数の水平方向画素及び前記複数の垂直方向画素の何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けるすること、
を更に具備するC55の方法。
[C57]前記少なくとも1つのコーナ位置は、
左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれるC56の方法。
[C58]画像の領域を走査する手段と、
テキストを含んでいるか非テキスト含んでいるかで、領域を分類する手段と、
テキスト含んでいる領域内のあらゆる見失ったコーナを識別する手段と、及び
エッジマップに見失ったコーナを加える手段と、
を含む装置。
[C59]前記画像内のオーバーラップする画素のブロックを得る手段と、及び
前記ブロック中の画素のヒストグラム(HistN)をプロットする手段と、を更に含み、
前記ヒストグラムは複数のビンを含み、各ビンは1画素の強度に相当するC58の装置。
[C60]背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断する手段を更に含み、
ここで、Max(HistN)はヒストグラム中の画素の最大数、Tot_Blk_Pixは画素の前記ブロック中の画素合計値であるC59の装置。
[C61]成分(NC)の数をNC=Sum(HistN>Th1)を使用して判断する手段を更に含み、
ここで、NCはヒストグラムに基づく第1の閾値Th1を超過した画素の数であるC60の装置。
[C62]BPRが第2の閾値Th2より大きいか否か判断する手段と、
NCが第3の閾値Th3未満か否か判断する手段、及び
BPRがTh2より大きく、NCがTh3未満である場合、画素の前記ブロックをテキスト含んでいる領域として分類する手段と、
を更に具備するC61の装置。
[C63]前記テキスト含んでいる領域上でパターンマッチングを行なう手段を更に具備するC62の装置。
[C64]非エッジ画素の位置を検出する手段と、
少なくとも1つのコーナ位置の非エッジ画素を計算に入れる手段と、
少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出する手段、及び
少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の垂直方向画素の位置を検出する手段と、
を更に具備するC63の装置。
[C65]前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断する手段、及び
前記複数の水平方向画素の何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けする手段を更に具備するC64の装置。
[C66]前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれるC65の装置。
[C67]プロセッサを具備する装置であって、
前記プロセッサは、
画像の領域を走査し、
テキストを含んでいるか非テキスト含んでいるかで、前記領域を分類し、
テキストを含んでいる領域内のあらゆる見失ったコーナを識別し、及び
エッジマップに前記見失ったコーナを追加するよう動作する装置。
[C68]前記プロセッサは更に、
前記画像内のオーバーラップしている画素のブロックを得て、及び
前記ブロック内画素のヒストグラム(HistN)をプロットし、
前記ヒストグラムは複数のビンを含み、各ビンは1つの画素強度に対応するC67の装置。
[C69]前記プロセッサは更に、
背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断し、
ここで、Max(HistN)は前記ヒストグラム中の画素の最大数であり、Tot_Blk_Pixは画素ブロック中の画素数の合計であるC68の装置。
[C70]前記プロセッサは更に、
成分数(NC)をNC=Sum(HistN>Th1)を使用して判断し、
ここでNCは、ヒストグラムに基づく第1の閾値Th1を超過する画素の数であるC69の装置。
[C71]前記プロセッサは更に、
BPRが第2の閾値Th2より大きいか否か判断し、
NCが第3の閾値Th3未満か否か判断し、及び
BPRがTh2より大きく、NCがTh3未満である場合、前記画素ブロックをテキスト含んでいる領域として分類するC70の装置。
[C72]前記プロセッサは更に、前記テキスト含んでいる領域上でパターンマッチングを行うC71の装置。
[C73]前記プロセッサは更に、
非エッジ画素の位置を検出し、
少なくとも1つのコーナ位置の非エッジ画素を考慮し、
前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の水平方向画素の位置を検出し、及び
前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の垂直方向画素の位置を検出するC72の装置。
[C74]前記プロセッサは更に、
前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断し、及び
前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けするC73の装置。
[C75]前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれるC74の装置。
[C76]コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
前記コンピュータ可読媒体は、
画像領域を走査するための少なくとも1つの命令と、
前記領域をテキストを含んでいるか非テキスト含んでいるかで分類するための少なくとも1つの命令と、
テキスト含んでいる領域内のあらゆる見失ったコーナを識別するための少なくとも1つの命令、及び
エッジマップに前記見失ったコーナを追加するための少なくとも1つの命令とを具備するコンピュータ・プログラム製品。
[C77]前記コンピュータ可読媒体は更に、
前記画像内のオーバーラップしている画素ブロックを得るための少なくとも1つの命令、及び
前記ブロック内画素のヒストグラム(HistN)をプロットするための少なくとも1つの命令を具備し、
ここで前記ヒストグラムは、複数のビンを含み、各ビンは1つの画素強度に対応するC76のコンピュータ・プログラム製品。
[C78]前記コンピュータ可読媒体は更に、
背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断するための少なくとも1つの命令を更に具備し、
ここで前記Max(HistN)は、前記ヒストグラム中の画素の最大数であ、Tot_Blk_Pixは、前記画素ブロック中画素の画素数の合計であるC77のコンピュータ・プログラム製品。
[C79]前記コンピュータ可読媒体は更に、
成分の数(NC)をNC=Sum(HistN>Th1)を使用して判断するための少なくとも1つの命令を具備し、
ここでNCは、ヒストグラムに基づく第1の閾値Th1を超過する画素の数であるC78のコンピュータ・プログラム製品。
[C80]前記コンピュータ可読媒体は更に、
BPRが第2の閾値Th2より大きいか否か判断するための少なくとも1つの命令と、
NCが第3の閾値Th3未満か否か判断するための少なくとも1つの命令、及び
BPRがTh2より大きく、NCがTh3未満である場合、前記画素のブロックをテキスト含んでいる領域として分類するための少なくとも1つの命令と、を具備するC79のコンピュータ・プログラム製品。
[C81]前記コンピュータ可読媒体は更に、
前記テキスト含んでいる領域上でパターンマッチングを行なうための少なくとも1つの命令を具備するC80のコンピュータ・プログラム製品。
[C82]前記コンピュータ可読媒体は更に、
非エッジ画素の位置を検出するための少なくとも1つの命令と、
少なくとも1つのコーナ位置の前記非エッジ画素を計算に入れるための少なくとも1つの命令と、
前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の水平方向画素の位置を検出するための少なくとも1つの命令、及び
前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出するための少なくとも1つの命令とを具備するC81のコンピュータ・プログラム製品。
[C83]前記コンピュータ可読媒体は更に、
前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断するための少なくとも1つの命令、及び
前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けするための少なくとも1つの命令と、を具備するC82のコンピュータ・プログラム製品。
[C84]前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれるC83のコンピュータ・プログラム製品。
[C85]相互エッジ/相互中点予測方法であって、
以前のフレームデータを受信すること、
探索半径を1に等しく初期化すること、
以前のフレームデータ中の共通位置の点周辺を前記探索半径を使用して走査すること、及び
基準点が検出されたか否か判断すること、
を具備する方法。
[C86]前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含むC85の方法。
[C87]前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含むC85の方法。
[C88]前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定することを更に具備するC85の方法。
[C89]前記基準点が検出されたない場合、前記探索半径を1だけ増加させ、及び
前記探索半径が最大の範囲に等しいか否か判断すること、を更に具備するC85の方法。
[C90]前記探索半径が前記最大の範囲と等しくない場合、前記以前のフレームデータ中の共通位置の点周辺を前記探索半径を使用して走査すること、
基準点が検出されるか否か判断すること、及び
前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定すること、を更に具備するC89の方法。
[C91]前記探索半径が前記最大の範囲と等しい場合、所定初期値と等しい相互予測値を設定すること、を更に具備するC89の方法。
[C92]前記所定初期値は、フレームデータの値の範囲における中央の値であるC91の方法。
[C93]以前のフレームデータを受信する手段と、
探索半径を1に等しく初期化する手段と、
前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査する手段、及び
基準点が検出されたか否か判断する手段と、
を具備する装置。
[C94]前記以前のフレームデータ及び前記基準点は、少なくとも1つの中点を含むC93の装置。
[C95]前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含むC93の装置。
[C96]前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する手段を更に具備するC93の装置。
[C97]前記基準点が検出されない場合、前記探索半径を1だ増加させる手段、及び
前記探索半径が最大範囲に等しいか否か判断する手段と、を更に具備するC93の装置。
[C98]前記探索半径が前記最大の範囲に等しくない場合、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査する手段と、
基準点が検出されたか否か判断する手段、及び
前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する手段と、を更に具備するC97の装置。
[C99]前記探索半径が最大の範囲に等しい場合、所定初期値に等しい相互予測値を設定する手段を更に具備するC97の装置。
[C100]前記所定初期値はフレームデータの一連の値内の中央の値であるC99の装置。
[C101]プロセッサを含む装置であって、
前記プロセッサは、
以前のフレームデータを受信する受信し、
探索半径を1に等しく初期化し、
前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査し、及び
基準点が検出されたか否か判断するよう動作する装置。
[C102]前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含むC101の装置。
[C103]前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含むC101の装置。
[C104]前記プロセッサは更に、
前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定するC101の装置。
[C105]前記プロセッサは更に、
前記基準点が検出されない場合、前記探索半径を1だけ増加させ、及び
前記探索半径が最大の範囲に等しいか否か判断するC101の装置。
[C106]前記プロセッサは更に、
前記探索半径が最大の範囲に等しくない場合、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査し、
基準点が検出されたか否か判断し、及び
前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定するC105の装置。
[C107]前記プロセッサは更に、
前記探索半径が最大の範囲に等しい場合、所定初期値に等しい相互予測値を設定するC105の装置。
[C108]前記所定初期値はフレームデータの値の範囲内の中央の値であるC107の装置。
[C109]コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
前記コンピュータ可読媒体は、
以前のフレームデータを受信するための少なくとも1つの命令と、
探索半径を1に等しく初期化するための少なくとも1つの命令と、
前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査するための少なくとも1つの命令、及び
基準点が検出されたか否か判断するための少なくとも1つの命令を具備する。
[C110]前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含むC109のコンピュータ・プログラム製品。
[C111]前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含むC109のコンピュータ・プログラム製品。
[C112]前記コンピュータ可読媒体は更に、
前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定するための少なくとも1つの命令を具備するC109のコンピュータ・プログラム製品。
[C113]前記コンピュータ可読媒体は更に、
前記基準点が検出されない場合、前記探索半径を1だけ増加させるための少なくとも1つの命令、及び
前記探索半径が最大範囲に等しいか否か判断するための少なくとも1つの命令を具備するC109のコンピュータ・プログラム製品。
[C114]前記コンピュータ可読媒体は更に、
前記探索半径が最大の範囲に等しくないとき、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査するための少なくとも1つの命令と、
基準点が検出されたか否か判断するための少なくとも1つの命令、及び
前記基準点が検出されない場合、前記基準点の値に等しい相互予測値を設定するための少なくとも1つの命令、
を具備するC113のコンピュータ・プログラム製品。
[C115]前記コンピュータ可読媒体は更に、
探索半径は最大の範囲と等しい場合、所定初期値と等しい相互予測値を設定するための少なくとも1つの命令を具備するC113のコンピュータ・プログラム製品。
[C116]前記所定初期値はフレームデータの値における中央の値であるC115のコンピュータ・プログラム製品。
[C117]内部エッジ/内部中点予測方法であって、
複数の送信された画素を判断すること、
画像を、複数の所定サイズの画素ブロックに分割すること、及び
各画素ブロック内のいずれかの画素が、前記複数の送信された画素内にあるか判断すること、を具備する方法。
[C118]前記複数の送信された画素が、複数のエッジ画素及び複数の中点画素を含むC117の方法。
[C119]前記所定サイズは最後の反復中のスケールファクタに等しく設定されるC117の方法。
[C120]前記画素ブロック内画素の何れも前記複数の送信された画素内にない場合、所定初期値と等しい予測値を設定することを更に具備するC117の方法。
[C121]前記画素ブロック内の送信された全ての画素値の平均に等しい予測値を設定することを更に具備するC120の方法。
[C122]送信されていない画素の残余部を判断することを更に具備するC121の方法。
[C123]前記送信されていない画素の残余部は、実際値から予測値を引いた値を含むC122の方法。
[C124]複数の送信された画素を判断する手段と、
画像を所定サイズの複数の画素ブロックに分割する手段、及び
各ブロック内のいずれかの画素が、前記複数の送信された画素内の画素か否か判断する手段と、
を具備する装置。
[C125]前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含むC124の装置。
[C126]前記所定サイズは最後の反復におけるスケールファクタと等しく設定されるC124の装置。
[C127]前記画素ブロック内画素の何れも前記複数の送信された画素内にない場合、所定初期値に等しい予測値を設定する手段を更に具備するC124の装置。
[C128]前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定する手段を更に具備するC127の装置。
[C129]送付されていない画素の残余部を判断する手段を更に具備するC128の装置。
[C130]前記送付されていない画素の残余部は実際値から予測値を引いた値を含むC129の装置。
[C131]プロセッサを具備する装置であって、
前記プロセッサは、
複数の送信された画素を判断し、
画像を所定サイズの複数の画素ブロックに分割し、及び
各画素ブロック内の何れかの画素が、前記複数の送信された画素内にあるか判断するよう動作する装置。
[C132]前記複数の送信された画素は複数のエッジ画素及び複数の中点画素を含むC131の装置。
[C133]前記所定サイズは、最後の反復におけるスケールファクタと等しく設定されるC131の装置。
[C134]前記プロセッサは更に、
前記画素ブロック内の画素の何れも前記複数の送信された画素内にない場合、所定初期値に等しい予測値を設定するC131の装置。
[C135]前記プロセッサは更に、
前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定することを具備するC134の装置。
[C136]前記プロセッサは更に、
送付されていない画素の残余部を判断することを具備するC135の装置。
[C137]前記送付されていない画素の残余部は、実際値から予測値を引いた値を含むC136の装置。
[C138]コンピュータ可読媒体を含むコンピュータ・プログラム製品であって、
前記コンピュータ可読媒体は、
複数の送信された画素を判断するための少なくとも1つの命令と、
画像を所定サイズの複数の画素ブロックに分割するための少なくとも1つの命令、及び
各画素ブロック内のいずれかの画素が、複数の送信された画素内にあるか否か判断するための少なくとも1つの命令を具備する。
[C139]前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含むC138のコンピュータ・プログラム製品。
[C140]前記所定サイズは、最後の反復におけるスケールファクタに等しく設定されるC138のコンピュータ・プログラム製品。
[C141]前記コンピュータ可読媒体は更に、
前記画素ブロック内画素のいずれも複数の送信された画素内にない場合、所定初期値と等しい予測値を設定するための少なくとも1つの命令を具備するC138のコンピュータ・プログラム製品。
[C142]コンピュータ可読媒体は更に、
前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定するための少なくとも1つの命令を具備するC138のコンピュータ・プログラム製品。
[C143]前記コンピュータ可読媒体は更に、
送付されていない画素の残余部を判断するための少なくとも1つの命令を具備するC142のコンピュータ・プログラム製品。
[C144]前記送付されていない画素の残余部は実際値から予測値を引いた値を含むC143のコンピュータ・プログラム製品。
[C145]中点を改良する方法であって、
複数の中点を受信すること、
前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査すること、
現在の画素位置が最大の走査距離より大きいか否か判断すること、及び
前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断すること、
を具備する方法。
[C146]前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断すること、及び
前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除すること、を更に具備するC145の方法。
[C147]前記所定数の方向は8方向を含むC145の方法。
[C148]前記所定ステップ角は45度であるC147の方法。
[C149]複数の中点を受信する手段と、
前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査する手段と、
現在の画素位置が最大の走査距離より大きいか否か判断する手段、及び
前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断する手段、を具備する装置。
[C150]前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断する手段と、
前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除する手段と、
を更に具備するC149の装置。
[C151]前記所定数の方向は8方向を含むC149の装置。
[C152]前記所定ステップ角は45度であるC151の装置。
[C153]プロセッサを含む装置であって、
前記プロセッサは、
複数の中点を受信し、
前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査し、
現在の画素位置が最大の走査距離より大きいか否か判断し、及び
前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断するよう動作する装置。
[C154]前記プロセッサは更に、
前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断し、及び
前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除するC153の装置。
[C155]前記所定数の方向は8方向を含むC153の装置。
[C156]前記所定ステップ角は45度であるC155の装置。
[C157]コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
前記コンピュータ可読媒体は、
複数の中点を受信するための少なくとも1つの命令と、
前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査するための少なくとも1つの命令と、
現在の画素位置が最大の走査距離より大きいか否か判断するための少なくとも1つの命令、及び前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断するための少なくとも1つの命令、
を具備するコンピュータ・プログラム製品。
[C158]前記コンピュータ可読媒体は更に、
前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断するための少なくとも1つの命令、及び
前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除するための少なくとも1つの命令、
を具備するC157のコンピュータ・プログラム製品。
[C159]前記所定数の方向は8方向を含むC157のコンピュータ・プログラム製品。
[C160]前記所定ステップ角は45度であるC159のコンピュータ・プログラム製品。

Claims (160)

  1. 画素値を補間する方法であって、
    見失った画素の位置を検出すること、
    複数の最も接近している画素を判断すること、
    前記複数の最も接近している画素それぞれの値を判断すること、
    前記見失った画素と前記複数の最も接近している画素それぞれの間の距離を判断すること、
    前記最も接近している画素それぞれを、エッジ画素か非エッジ画素のいずれかに分類すること、
    前記見失った画素の値を、前記最も接近している複数の画素それぞれの値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断すること、
    を含む方法。
  2. 前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む請求項1の方法。
  3. 前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含む請求項2の方法。
  4. 垂直軸に沿った前記第1の画素は第1の値を含み、
    垂直軸に沿った前記第2の画素は第2の値を含み、
    水平軸に沿った前記第3の画素は第3の値を含み、及び
    水平軸に沿った前記第4の画素は第4の値を含む請求項3の方法。
  5. 垂直軸に沿った前記第1の画素は第1の分類を含み、
    垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った前記第4の画素は第4の分類を含む請求項4の方法。
  6. 前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定すること、
    前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定すること、
    前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定すること、及び
    第4の分類がエッジ画素あるいは非エッジ画素である場合に、0または1に等しい第4のマスクを設定すること、
    を更に具備する請求項5の方法。
  7. 垂直の予測値を判断することを更に含み、
    前記垂直の予測値はVert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここでVert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、及びaは第1の距離である請求項6の方法。
  8. 水平の予測値を判断することを更に含み、前記水平の予測値はHorz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、
    ここで、Horz_Predは垂直の予測値、LCは第3のマスク、Cは第3の値、dは第4の距離、LDは第4のマスク、Dは第4の値、及びcは第3の距離である請求項7の方法。
  9. 前記見失った画素の補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断することを更に含み、
    ここで、Vert_Predは前記垂直の予測値、Horz_Predは前記水平の予測値である請求項8の方法。
  10. 前記非エッジ画素は中点画素である請求項1の方法。
  11. 前記中点画素は、基本層(base layer)ビットストリーム、上位層(enhancement layer)ビットストリームあるいはそれらの組み合わせから得られる請求項10の方法。
  12. 前記最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれる請求項1の方法。
  13. 見失った画素の位置を検出する手段と、
    複数の最も接近している画素を判断する手段と、
    複数最も接近している画素それぞれの値を判断する手段と、
    前記見失った画素と前記複数の最も接近している画素との間の各距離を判断する手段と、
    前記最も接近している画素のそれぞれを、エッジ画素あるいは非エッジ画素のいずれかに分類する手段と、
    前記見失った画素の値を、前記複数最も接近している画素の各値、前記見失った画素と前記複数最も接近している画素との間の各距離、及び前記複数最も接近している画素の各分類に少なくとも部分的に基づいて判断する手段を含むデコーダ装置。
  14. 前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む請求項13のデコーダ装置。
  15. 前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含む請求項14のデコーダ装置。
  16. 垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った第2の画素は第2の値を含み、水平軸に沿った第3の画素は第3の値を含み、及び水平軸に沿った第4の画素は第4の値を含む請求項15のデコーダ装置。
  17. 垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った第2の画素は第2の分類を含み、水平軸に沿った第3の画素は第3の分類を含み、及び水平軸に沿った第4の画素は第4の分類を含む請求項16のデコーダ装置。
  18. 前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定する手段と、
    前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定する手段と、
    前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定する手段と、及び
    前記第4の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第4のマスクを設定する手段、を更に具備する請求項17のデコーダ装置。
  19. 垂直の予測値を判断する手段を更に含み、
    前記垂直の予測値はVert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、ここで、Vert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、及びaは第1の距離である+B1062請求項18のデコーダ装置。
  20. 水平の予測値を判断する手段を更に含み、
    ここで、水平の予測値はHorz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、ここでHorz_Predは垂直の予測値、LCは第3のマスク、Cは第3の値、dは第4の距離、LDは第4のマスク、Dは第4の値、及びcは第3の距離である+B1065請求項19のデコーダ装置。
  21. 前記見失った画素に対する補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断する手段を更に含み、
    ここで、Vert_Predは垂直の予測値、及びHorz_Predは水平の予測値である請求項20のデコーダ装置。
  22. 前記非エッジ画素は中点画素である請求項13のデコーダ装置。
  23. 前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらの設定み合わせから得られる請求項22のデコーダ装置。
  24. 前記複数の最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれる請求項13のデコーダ装置。
  25. プロセッサを含む装置であって、前記プロセッサは、
    見失った画素の位置を検出し、
    複数の最も接近している画素を判断し、
    前記複数の最も接近している画素それぞれの値を判断し、
    前記見失った画素と前記複数最も接近している画素との間の各距離を判断し、
    複数最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとしてを分類し、及び
    前記見失った画素の値を、前記複数最も接近している画素の各値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数の最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断する、
    ように動作する装置。
  26. 前記複数の最も接近している画素は、垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む請求項25の装置。
  27. 前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離及び水平軸に沿った第4の距離を含む請求項26の装置。
  28. 垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含む請求項27の装置。
  29. 垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った第4の画素は第4の分類を含む請求項28の装置。
  30. プロセッサは更に、
    前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定し、
    前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定し、
    前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定し、及び
    前記第4の分類がエッジ画素あるいは非エッジ画素である場合は、0または1に等しい第4のマスクを設定する請求項29の装置。
  31. プロセッサは更に、
    垂直の予測値を判断し、前記垂直の予測値は、Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断され、
    ここで、Vert_Predは垂直の予測値、LAは第1のマスク、Aは第1の値、bは第2の距離、LBは第2のマスク、Bは第2の値、aは第1の距離である請求項30の装置。
  32. プロセッサは更に、
    水平の予測値を判断し、前記水平の予測値は、Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断され、
    ここで、Horz_Predは前記垂直の予測値、LCは前記第3のマスク、Cは前記第3の値、dは前記第4の距離、LDは前記第4のマスク、Dは前記第4の値、及びcは前記第3の距離である請求項31の装置。
  33. プロセッサは更に、
    前記見失った画素に対する補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断し、
    ここで、Vert_Predは前記垂直の予測値、及びHorz_Predは前記水平の予測値である請求項32の装置。
  34. 前記非エッジ画素は中点画素である請求項25の装置。
  35. 前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらを設定み合わせから得られる請求項34の装置。
  36. 前記複数の最も接近している画素それぞれの値は、輝度値、色濃度値、コントラスト値あるいは勾配値から成るグループから選ばれる請求項25の装置。
  37. コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
    前記コンピュータ可読媒体は、
    見失った画素の位置を検出するための少なくとも1つの命令、
    複数の最も接近している画素を判断するための少なくとも1つの命令、
    前記複数の最も接近している画素それぞれの値を判断するための少なくとも1つの命令、
    前記見失った画素と前記複数の最も接近している画素との間の各距離を判断するための少なくとも1つの命令、
    前記複数の各々の最も接近している画素それぞれを、エッジ画素あるいは非エッジ画素のいずれかとして分類するための少なくとも1つの命令、及び
    前記見失った画素の値を、前記複数最も接近している画素それぞれの値、前記見失った画素と前記複数の最も接近している画素との間の各距離、及び前記複数最も接近している画素それぞれの分類に少なくとも部分的に基づいて判断するための少なくとも1つの命令、
    を含むコンピュータ・プログラム製品。
  38. 前記複数の最も接近している画素は垂直軸に沿った第1の画素、垂直軸に沿った第2の画素、水平軸に沿った第3の画素及び水平軸に沿った第4の画素を含む請求項37のコンピュータ・プログラム製品。
  39. 前記見失った画素と前記複数の最も接近している画素との間の各距離は、垂直軸に沿った第1の距離、垂直軸に沿った第2の距離、水平軸に沿った第3の距離、及び水平軸に沿った第4の距離を含む請求項38のコンピュータ・プログラム製品。
  40. 垂直軸に沿った前記第1の画素は第1の値を含み、垂直軸に沿った前記第2の画素は第2の値を含み、水平軸に沿った前記第3の画素は第3の値を含み、及び水平軸に沿った前記第4の画素は第4の値を含む請求項39のコンピュータ・プログラム製品。
  41. 垂直軸に沿った前記第1の画素は第1の分類を含み、垂直軸に沿った前記第2の画素は第2の分類を含み、水平軸に沿った前記第3の画素は第3の分類を含み、及び水平軸に沿った前記第4の画素は第4の分類を含む請求項40のコンピュータ・プログラム製品。
  42. 前記コンピュータ可読媒体は、
    前記第1の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第1のマスクを設定するための少なくとも1つの命令と、
    前記第2の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第2のマスクを設定するための少なくとも1つの命令と、
    前記第3の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第3のマスクを設定するための少なくとも1つの命令と、及び
    前記第4の分類がエッジ画素あるいは非エッジ画素である場合、0または1に等しい第4のマスクを設定するための少なくとも1つの命令とを含む、請求項41のコンピュータ・プログラム製品。
  43. 前記コンピュータ可読媒体は更に、
    Verrt_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)から判断される垂直の予測値を判断するための少なくとも1つの命令を含み、
    ここで、Vert_Predは前記垂直の予測値、LAは前記第1のマスク、Aは前記第1の値、bは前記第2の距離、LBは前記第2のマスク、Bは前記第2の値、及びaは前記第1の距離である請求項42のコンピュータ・プログラム製品。
  44. 前記コンピュータ可読媒体は更に、
    Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)から判断される水平の予測値を判断するための少なくとも1つの命令を含み、
    ここで、Horz_Predは前記垂直の予測値、LCは前記第3のマスク、Cは前記第3の値、dは前記第4の距離、LDは前記第4のマスク、Dは前記第4の値、及びcは前記第3の距離である請求項43のコンピュータ・プログラム製品。
  45. 前記コンピュータ可読媒体は更に、
    前記見失った画素の補間された値を、P=(Vert_Pred+Horz_Pred)/2から判断するための少なくとも1つの命令を含み、
    ここで、Vert_Predは前記垂直の予測値、Horz_Predは前記水平の予測値である請求項44のコンピュータ・プログラム製品。
  46. 前記非エッジ画素は中点画素である請求項37のコンピュータ・プログラム製品。
  47. 前記中点画素は、基本層ビットストリーム、上位層ビットストリームあるいはそれらを設定み合わせから得られる請求項46のコンピュータ・プログラム製品。
  48. 前記複数の最も接近している画素の値それぞれが、輝度値、色濃度値、コントラス値あるいは勾配値から成るグループから選ばれる請求項37のコンピュータ・プログラム製品。
  49. 選択的に画像コーナを改良する方法であって、
    画像の領域の走査すること、
    テキストを含んでいるか非テキスト含んでいるかで領域を分類すること、
    テキスト含んでいる領域内のあらゆる見失ったコーナを識別すること、及び
    エッジマップに前記見失ったコーナを加えること、
    を含む方法。
  50. 画像内のオーバーラップしている画素のブロックを得ること、及び
    前記ブロック中の画素のヒストグラム(HistN)をプロットすること、を更に含み、
    前記ヒストグラムは複数のビンを含み、各ビンは1つの画素強度に相当する請求項49の方法。
  51. 背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断することを更に含み、
    ここで、Max(HistN)は前記ヒストグラム中の画素の最大数であり、Tot_Blk_Pixは画素の前記ブロック中の画素数の合計値である請求項50の方法。
  52. 前記ヒストグラムに基づいて、成分(NC)の数をNC=Sum(HistN>Th1)を使用して判断することを更に含み、ここでNCは第1の閾値Th1を超過した画素数である請求項51の方法。
  53. BPRが第2の閾値Th2より大きいか否か判断すること、
    NCが前記第3の閾値Th3未満か否か判断すること、及び
    BPRがTh2より大きく、NCがTh3未満の場合、テキストを含んでいる領域として前記画素のブロックを分類すること、
    を更に具備する請求項52の方法。
  54. 前記テキストを含んでいる領域上でパターンマッチングを行なうことを更に具備する請求項53の方法。
  55. 非エッジ画素の位置を検出すること、
    少なくとも1つのコーナ位置の非エッジ画素を計算に入れること、
    前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出すること、及び
    前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の垂直方向画素の位置を検出すること、
    を更に具備する請求項54の方法。
  56. 前記複数の水平方向画素及び前記複数の垂直方向画素の何れかがエッジ画素か否か判断すること、及び
    前記複数の水平方向画素及び前記複数の垂直方向画素の何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けるすること、
    を更に具備する請求項55の方法。
  57. 前記少なくとも1つのコーナ位置は、
    左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる請求項56の方法。
  58. 画像の領域を走査する手段と、
    テキストを含んでいるか非テキスト含んでいるかで、領域を分類する手段と、
    テキスト含んでいる領域内のあらゆる見失ったコーナを識別する手段と、及び
    エッジマップに見失ったコーナを加える手段と、
    を含む装置。
  59. 前記画像内のオーバーラップする画素のブロックを得る手段と、及び
    前記ブロック中の画素のヒストグラム(HistN)をプロットする手段と、を更に含み、
    前記ヒストグラムは複数のビンを含み、各ビンは1画素の強度に相当する請求項58の装置。
  60. 背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断する手段を更に含み、
    ここで、Max(HistN)はヒストグラム中の画素の最大数、Tot_Blk_Pixは画素の前記ブロック中の画素合計値である請求項59の装置。
  61. 成分(NC)の数をNC=Sum(HistN>Th1)を使用して判断する手段を更に含み、
    ここで、NCはヒストグラムに基づく第1の閾値Th1を超過した画素の数である請求項60の装置。
  62. BPRが第2の閾値Th2より大きいか否か判断する手段と、
    NCが第3の閾値Th3未満か否か判断する手段、及び
    BPRがTh2より大きく、NCがTh3未満である場合、画素の前記ブロックをテキスト含んでいる領域として分類する手段と、
    を更に具備する請求項61の装置。
  63. 前記テキスト含んでいる領域上でパターンマッチングを行なう手段を更に具備する請求項62の装置。
  64. 非エッジ画素の位置を検出する手段と、
    少なくとも1つのコーナ位置の非エッジ画素を計算に入れる手段と、
    少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出する手段、及び
    少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の垂直方向画素の位置を検出する手段と、
    を更に具備する請求項63の装置。
  65. 前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断する手段、及び
    前記複数の水平方向画素の何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けする手段を更に具備する請求項64の装置。
  66. 前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる請求項65の装置。
  67. プロセッサを具備する装置であって、
    前記プロセッサは、
    画像の領域を走査し、
    テキストを含んでいるか非テキスト含んでいるかで、前記領域を分類し、
    テキストを含んでいる領域内のあらゆる見失ったコーナを識別し、及び
    エッジマップに前記見失ったコーナを追加するよう動作する装置。
  68. 前記プロセッサは更に、
    前記画像内のオーバーラップしている画素のブロックを得て、及び
    前記ブロック内画素のヒストグラム(HistN)をプロットし、
    前記ヒストグラムは複数のビンを含み、各ビンは1つの画素強度に対応する請求項67の装置。
  69. 前記プロセッサは更に、
    背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断し、
    ここで、Max(HistN)は前記ヒストグラム中の画素の最大数であり、Tot_Blk_Pixは画素ブロック中の画素数の合計である請求項68の装置。
  70. 前記プロセッサは更に、
    成分数(NC)をNC=Sum(HistN>Th1)を使用して判断し、
    ここでNCは、ヒストグラムに基づく第1の閾値Th1を超過する画素の数である請求項69の装置。
  71. 前記プロセッサは更に、
    BPRが第2の閾値Th2より大きいか否か判断し、
    NCが第3の閾値Th3未満か否か判断し、及び
    BPRがTh2より大きく、NCがTh3未満である場合、前記画素ブロックをテキスト含んでいる領域として分類する請求項70の装置。
  72. 前記プロセッサは更に、前記テキスト含んでいる領域上でパターンマッチングを行う請求項71の装置。
  73. 前記プロセッサは更に、
    非エッジ画素の位置を検出し、
    少なくとも1つのコーナ位置の非エッジ画素を考慮し、
    前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の水平方向画素の位置を検出し、及び
    前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の垂直方向画素の位置を検出する請求項72の装置。
  74. 前記プロセッサは更に、
    前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断し、及び
    前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けする請求項73の装置。
  75. 前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる請求項74の装置。
  76. コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
    前記コンピュータ可読媒体は、
    画像領域を走査するための少なくとも1つの命令と、
    前記領域をテキストを含んでいるか非テキスト含んでいるかで分類するための少なくとも1つの命令と、
    テキスト含んでいる領域内のあらゆる見失ったコーナを識別するための少なくとも1つの命令、及び
    エッジマップに前記見失ったコーナを追加するための少なくとも1つの命令とを具備するコンピュータ・プログラム製品。
  77. 前記コンピュータ可読媒体は更に、
    前記画像内のオーバーラップしている画素ブロックを得るための少なくとも1つの命令、及び
    前記ブロック内画素のヒストグラム(HistN)をプロットするための少なくとも1つの命令を具備し、
    ここで前記ヒストグラムは、複数のビンを含み、各ビンは1つの画素強度に対応する請求項76のコンピュータ・プログラム製品。
  78. 前記コンピュータ可読媒体は更に、
    背景画素比(BPR)をBPR=Max(HistN)/Tot_Blk_Pixを使用して判断するための少なくとも1つの命令を更に具備し、
    ここで前記Max(HistN)は、前記ヒストグラム中の画素の最大数であ、Tot_Blk_Pixは、前記画素ブロック中画素の画素数の合計である請求項77のコンピュータ・プログラム製品。
  79. 前記コンピュータ可読媒体は更に、
    成分の数(NC)をNC=Sum(HistN>Th1)を使用して判断するための少なくとも1つの命令を具備し、
    ここでNCは、ヒストグラムに基づく第1の閾値Th1を超過する画素の数である請求項78のコンピュータ・プログラム製品。
  80. 前記コンピュータ可読媒体は更に、
    BPRが第2の閾値Th2より大きいか否か判断するための少なくとも1つの命令と、
    NCが第3の閾値Th3未満か否か判断するための少なくとも1つの命令、及び
    BPRがTh2より大きく、NCがTh3未満である場合、前記画素のブロックをテキスト含んでいる領域として分類するための少なくとも1つの命令と、を具備する請求項79のコンピュータ・プログラム製品。
  81. 前記コンピュータ可読媒体は更に、
    前記テキスト含んでいる領域上でパターンマッチングを行なうための少なくとも1つの命令を具備する請求項80のコンピュータ・プログラム製品。
  82. 前記コンピュータ可読媒体は更に、
    非エッジ画素の位置を検出するための少なくとも1つの命令と、
    少なくとも1つのコーナ位置の前記非エッジ画素を計算に入れるための少なくとも1つの命令と、
    前記少なくとも1つのコーナ位置の前記非エッジ画素に最も近い複数の水平方向画素の位置を検出するための少なくとも1つの命令、及び
    前記少なくとも1つのコーナ位置の非エッジ画素に最も近い複数の水平方向画素の位置を検出するための少なくとも1つの命令とを具備する請求項81のコンピュータ・プログラム製品。
  83. 前記コンピュータ可読媒体は更に、
    前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素か否か判断するための少なくとも1つの命令、及び
    前記複数の水平方向画素のうち何れか及び前記複数の垂直方向画素のうち何れかがエッジ画素である場合、前記非エッジ画素をエッジ画素としてラベル付けするための少なくとも1つの命令と、を具備する請求項82のコンピュータ・プログラム製品。
  84. 前記少なくとも1つのコーナ位置は、左上コーナ位置、右上コーナ位置、左下コーナ位置、及び右下コーナ位置から成るグループから選ばれる請求項83のコンピュータ・プログラム製品。
  85. 相互エッジ/相互中点予測方法であって、
    以前のフレームデータを受信すること、
    探索半径を1に等しく初期化すること、
    以前のフレームデータ中の共通位置の点周辺を前記探索半径を使用して走査すること、及び
    基準点が検出されたか否か判断すること、
    を具備する方法。
  86. 前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含む請求項85の方法。
  87. 前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む請求項85の方法。
  88. 前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定することを更に具備する請求項85の方法。
  89. 前記基準点が検出されたない場合、前記探索半径を1だけ増加させ、及び
    前記探索半径が最大の範囲に等しいか否か判断すること、を更に具備する請求項85の方法。
  90. 前記探索半径が前記最大の範囲と等しくない場合、前記以前のフレームデータ中の共通位置の点周辺を前記探索半径を使用して走査すること、
    基準点が検出されるか否か判断すること、及び
    前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定すること、を更に具備する請求項89の方法。
  91. 前記探索半径が前記最大の範囲と等しい場合、所定初期値と等しい相互予測値を設定すること、を更に具備する請求項89の方法。
  92. 前記所定初期値は、フレームデータの値の範囲における中央の値である請求項91の方法。
  93. 以前のフレームデータを受信する手段と、
    探索半径を1に等しく初期化する手段と、
    前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査する手段、及び
    基準点が検出されたか否か判断する手段と、
    を具備する装置。
  94. 前記以前のフレームデータ及び前記基準点は、少なくとも1つの中点を含む請求項93の装置。
  95. 前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む請求項93の装置。
  96. 前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する手段を更に具備する請求項93の装置。
  97. 前記基準点が検出されない場合、前記探索半径を1だ増加させる手段、及び
    前記探索半径が最大範囲に等しいか否か判断する手段と、を更に具備する請求項93の装置。
  98. 前記探索半径が前記最大の範囲に等しくない場合、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査する手段と、
    基準点が検出されたか否か判断する手段、及び
    前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する手段と、を更に具備する請求項97の装置。
  99. 前記探索半径が最大の範囲に等しい場合、所定初期値に等しい相互予測値を設定する手段を更に具備する請求項97の装置。
  100. 前記所定初期値はフレームデータの一連の値内の中央の値である請求項99の装置。
  101. プロセッサを含む装置であって、
    前記プロセッサは、
    以前のフレームデータを受信する受信し、
    探索半径を1に等しく初期化し、
    前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査し、及び
    基準点が検出されたか否か判断するよう動作する装置。
  102. 前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含む請求項101の装置。
  103. 前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む請求項101の装置。
  104. 前記プロセッサは更に、
    前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する請求項101の装置。
  105. 前記プロセッサは更に、
    前記基準点が検出されない場合、前記探索半径を1だけ増加させ、及び
    前記探索半径が最大の範囲に等しいか否か判断する請求項101の装置。
  106. 前記プロセッサは更に、
    前記探索半径が最大の範囲に等しくない場合、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査し、
    基準点が検出されたか否か判断し、及び
    前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定する請求項105の装置。
  107. 前記プロセッサは更に、
    前記探索半径が最大の範囲に等しい場合、所定初期値に等しい相互予測値を設定する請求項105の装置。
  108. 前記所定初期値はフレームデータの値の範囲内の中央の値である請求項107の装置。
  109. コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
    前記コンピュータ可読媒体は、
    以前のフレームデータを受信するための少なくとも1つの命令と、
    探索半径を1に等しく初期化するための少なくとも1つの命令と、
    前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査するための少なくとも1つの命令、及び
    基準点が検出されたか否か判断するための少なくとも1つの命令を具備する。
  110. 前記以前のフレームデータ及び前記基準点は少なくとも1つの中点を含む請求項109のコンピュータ・プログラム製品。
  111. 前記以前のフレームデータ及び前記基準点は少なくとも1つのエッジを含む請求項109のコンピュータ・プログラム製品。
  112. 前記コンピュータ可読媒体は更に、
    前記基準点が検出された場合、前記基準点の値に等しい相互予測値を設定するための少なくとも1つの命令を具備する請求項109のコンピュータ・プログラム製品。
  113. 前記コンピュータ可読媒体は更に、
    前記基準点が検出されない場合、前記探索半径を1だけ増加させるための少なくとも1つの命令、及び
    前記探索半径が最大範囲に等しいか否か判断するための少なくとも1つの命令を具備する請求項109のコンピュータ・プログラム製品。
  114. 前記コンピュータ可読媒体は更に、
    前記探索半径が最大の範囲に等しくないとき、前記探索半径を使用して、前記以前のフレームデータ中の共通位置の点周辺を走査するための少なくとも1つの命令と、
    基準点が検出されたか否か判断するための少なくとも1つの命令、及び
    前記基準点が検出されない場合、前記基準点の値に等しい相互予測値を設定するための少なくとも1つの命令、
    を具備する請求項113のコンピュータ・プログラム製品。
  115. 前記コンピュータ可読媒体は更に、
    探索半径は最大の範囲と等しい場合、所定初期値と等しい相互予測値を設定するための少なくとも1つの命令を具備する請求項113のコンピュータ・プログラム製品。
  116. 前記所定初期値はフレームデータの値における中央の値である請求項115のコンピュータ・プログラム製品。
  117. 内部エッジ/内部中点予測方法であって、
    複数の送信された画素を判断すること、
    画像を、複数の所定サイズの画素ブロックに分割すること、及び
    各画素ブロック内のいずれかの画素が、前記複数の送信された画素内にあるか判断すること、を具備する方法。
  118. 前記複数の送信された画素が、複数のエッジ画素及び複数の中点画素を含む請求項117の方法。
  119. 前記所定サイズは最後の反復中のスケールファクタに等しく設定される請求項117の方法。
  120. 前記画素ブロック内画素の何れも前記複数の送信された画素内にない場合、所定初期値と等しい予測値を設定することを更に具備する請求項117の方法。
  121. 前記画素ブロック内の送信された全ての画素値の平均に等しい予測値を設定することを更に具備する請求項120の方法。
  122. 送信されていない画素の残余部を判断することを更に具備する請求項121の方法。
  123. 前記送信されていない画素の残余部は、実際値から予測値を引いた値を含む請求項122の方法。
  124. 複数の送信された画素を判断する手段と、
    画像を所定サイズの複数の画素ブロックに分割する手段、及び
    各ブロック内のいずれかの画素が、前記複数の送信された画素内の画素か否か判断する手段と、
    を具備する装置。
  125. 前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含む請求項124の装置。
  126. 前記所定サイズは最後の反復におけるスケールファクタと等しく設定される請求項124の装置。
  127. 前記画素ブロック内画素の何れも前記複数の送信された画素内にない場合、所定初期値に等しい予測値を設定する手段を更に具備する請求項124の装置。
  128. 前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定する手段を更に具備する請求項127の装置。
  129. 送付されていない画素の残余部を判断する手段を更に具備する請求項128の装置。
  130. 前記送付されていない画素の残余部は実際値から予測値を引いた値を含む請求項129の装置。
  131. プロセッサを具備する装置であって、
    前記プロセッサは、
    複数の送信された画素を判断し、
    画像を所定サイズの複数の画素ブロックに分割し、及び
    各画素ブロック内の何れかの画素が、前記複数の送信された画素内にあるか判断するよう動作する装置。
  132. 前記複数の送信された画素は複数のエッジ画素及び複数の中点画素を含む請求項131の装置。
  133. 前記所定サイズは、最後の反復におけるスケールファクタと等しく設定される請求項131の装置。
  134. 前記プロセッサは更に、
    前記画素ブロック内の画素の何れも前記複数の送信された画素内にない場合、所定初期値に等しい予測値を設定する請求項131の装置。
  135. 前記プロセッサは更に、
    前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定することを具備する請求項134の装置。
  136. 前記プロセッサは更に、
    送付されていない画素の残余部を判断することを具備する請求項135の装置。
  137. 前記送付されていない画素の残余部は、実際値から予測値を引いた値を含む請求項136の装置。
  138. コンピュータ可読媒体を含むコンピュータ・プログラム製品であって、
    前記コンピュータ可読媒体は、
    複数の送信された画素を判断するための少なくとも1つの命令と、
    画像を所定サイズの複数の画素ブロックに分割するための少なくとも1つの命令、及び
    各画素ブロック内のいずれかの画素が、複数の送信された画素内にあるか否か判断するための少なくとも1つの命令を具備する。
  139. 前記複数の送信された画素は、複数のエッジ画素及び複数の中点画素を含む請求項138のコンピュータ・プログラム製品。
  140. 前記所定サイズは、最後の反復におけるスケールファクタに等しく設定される請求項138のコンピュータ・プログラム製品。
  141. 前記コンピュータ可読媒体は更に、
    前記画素ブロック内画素のいずれも複数の送信された画素内にない場合、所定初期値と等しい予測値を設定するための少なくとも1つの命令を具備する請求項138のコンピュータ・プログラム製品。
  142. コンピュータ可読媒体は更に、
    前記画素ブロック内の送信された全ての画素値の平均値に等しい予測値を設定するための少なくとも1つの命令を具備する請求項138のコンピュータ・プログラム製品。
  143. 前記コンピュータ可読媒体は更に、
    送付されていない画素の残余部を判断するための少なくとも1つの命令を具備する請求項142のコンピュータ・プログラム製品。
  144. 前記送付されていない画素の残余部は実際値から予測値を引いた値を含む請求項143のコンピュータ・プログラム製品。
  145. 中点を改良する方法であって、
    複数の中点を受信すること、
    前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査すること、
    現在の画素位置が最大の走査距離より大きいか否か判断すること、及び
    前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断すること、
    を具備する方法。
  146. 前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断すること、及び
    前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除すること、を更に具備する請求項145の方法。
  147. 前記所定数の方向は8方向を含む請求項145の方法。
  148. 前記所定ステップ角は45度である請求項147の方法。
  149. 複数の中点を受信する手段と、
    前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査する手段と、
    現在の画素位置が最大の走査距離より大きいか否か判断する手段、及び
    前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断する手段、を具備する装置。
  150. 前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断する手段と、
    前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除する手段と、
    を更に具備する請求項149の装置。
  151. 前記所定数の方向は8方向を含む請求項149の装置。
  152. 前記所定ステップ角は45度である請求項151の装置。
  153. プロセッサを含む装置であって、
    前記プロセッサは、
    複数の中点を受信し、
    前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査し、
    現在の画素位置が最大の走査距離より大きいか否か判断し、及び
    前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断するよう動作する装置。
  154. 前記プロセッサは更に、
    前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断し、及び
    前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除する請求項153の装置。
  155. 前記所定数の方向は8方向を含む請求項153の装置。
  156. 前記所定ステップ角は45度である請求項155の装置。
  157. コンピュータ可読媒体を具備するコンピュータ・プログラム製品であって、
    前記コンピュータ可読媒体は、
    複数の中点を受信するための少なくとも1つの命令と、
    前記複数の中点画素各々から、所定ステップ角で所定数の方向に、前記複数の画素を走査するための少なくとも1つの命令と、
    現在の画素位置が最大の走査距離より大きいか否か判断するための少なくとも1つの命令、及び前記現在の画素位置が前記最大の走査距離より大きくない場合、現在の画素がエッジ画素か否か判断するための少なくとも1つの命令、
    を具備するコンピュータ・プログラム製品。
  158. 前記コンピュータ可読媒体は更に、
    前記現在の画素がエッジ画素でない場合、前記現在の画素が中点画素か否か判断するための少なくとも1つの命令、及び
    前記現在の画素が中点画素である場合、中点マップから前記現在の画素を削除するための少なくとも1つの命令、
    を具備する請求項157のコンピュータ・プログラム製品。
  159. 前記所定数の方向は8方向を含む請求項157のコンピュータ・プログラム製品。
  160. 前記所定ステップ角は45度である請求項159のコンピュータ・プログラム製品。
JP2014015852A 2009-07-29 2014-01-30 ビデオコンテンツを圧縮するシステム及び方法 Expired - Fee Related JP5976702B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/511,349 2009-07-29
US12/511,349 US9129409B2 (en) 2009-07-29 2009-07-29 System and method of compressing video content

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012523033A Division JP5539515B2 (ja) 2009-07-29 2010-07-29 ビデオコンテンツを圧縮するシステム及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015144270A Division JP2016006979A (ja) 2009-07-29 2015-07-21 ビデオコンテンツを圧縮するシステム及び方法

Publications (2)

Publication Number Publication Date
JP2014123962A true JP2014123962A (ja) 2014-07-03
JP5976702B2 JP5976702B2 (ja) 2016-08-24

Family

ID=42988398

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2012523033A Expired - Fee Related JP5539515B2 (ja) 2009-07-29 2010-07-29 ビデオコンテンツを圧縮するシステム及び方法
JP2014015852A Expired - Fee Related JP5976702B2 (ja) 2009-07-29 2014-01-30 ビデオコンテンツを圧縮するシステム及び方法
JP2015144270A Pending JP2016006979A (ja) 2009-07-29 2015-07-21 ビデオコンテンツを圧縮するシステム及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2012523033A Expired - Fee Related JP5539515B2 (ja) 2009-07-29 2010-07-29 ビデオコンテンツを圧縮するシステム及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015144270A Pending JP2016006979A (ja) 2009-07-29 2015-07-21 ビデオコンテンツを圧縮するシステム及び方法

Country Status (6)

Country Link
US (1) US9129409B2 (ja)
EP (5) EP2667605A3 (ja)
JP (3) JP5539515B2 (ja)
KR (6) KR20150116903A (ja)
CN (5) CN102484710B (ja)
WO (1) WO2011014633A2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156967B (zh) * 2011-04-11 2012-10-17 上海交通大学 基于多尺度的局部的图像内插方法
US8681866B1 (en) 2011-04-28 2014-03-25 Google Inc. Method and apparatus for encoding video by downsampling frame resolution
US8780976B1 (en) 2011-04-28 2014-07-15 Google Inc. Method and apparatus for encoding video using granular downsampling of frame resolution
US10536726B2 (en) * 2012-02-24 2020-01-14 Apple Inc. Pixel patch collection for prediction in video coding system
US9524536B2 (en) * 2014-07-25 2016-12-20 Intel Corporation Compression techniques for dynamically-generated graphics resources
WO2017061189A1 (ja) * 2015-10-05 2017-04-13 シャープ株式会社 画像復号装置または画像符号化装置のための画像予測装置
US20190075319A1 (en) * 2016-03-08 2019-03-07 Interdigital Vc Holdings, Inc. Methods for performing an intra prediction encoding and decoding of at least one picture, and corresponding electronic devices
US10785478B2 (en) 2016-05-12 2020-09-22 Lg Electronics Inc. Intra prediction method and apparatus for video coding
CN107786874A (zh) * 2016-08-24 2018-03-09 浙江大学 双向的帧内方向性预测方法和装置
US10791340B2 (en) * 2016-11-15 2020-09-29 Sony Corporation Method and system to refine coding of P-phase data
DE102018122295A1 (de) * 2018-09-12 2020-03-12 Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg Verfahren zur Kompression von Bilddaten
US10848772B2 (en) * 2018-09-28 2020-11-24 Ati Technologies Ulc Histogram-based edge/text detection
US10602177B1 (en) * 2018-10-01 2020-03-24 Novatek Microelectronics Corp. Frame rate up-conversion apparatus and operation method thereof
US11272185B2 (en) 2018-10-31 2022-03-08 Ati Technologies Ulc Hierarchical measurement of spatial activity for text/edge detection
CN111935484B (zh) * 2020-09-28 2021-01-19 广州佰锐网络科技有限公司 一种视频帧压缩编码方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521163A (ja) * 2000-01-17 2003-07-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ テキスト改良

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4558370A (en) * 1983-11-21 1985-12-10 International Business Machines Corporation Image processing method for graphics images
JP2507204B2 (ja) * 1991-08-30 1996-06-12 松下電器産業株式会社 映像信号符号化装置
US5400076A (en) 1991-11-30 1995-03-21 Sony Corporation Compressed motion picture signal expander with error concealment
JP3159327B2 (ja) 1991-11-30 2001-04-23 ソニー株式会社 動画像データ復号化装置
JP2621747B2 (ja) * 1992-10-06 1997-06-18 富士ゼロックス株式会社 画像処理装置
US5418714A (en) 1993-04-08 1995-05-23 Eyesys Laboratories, Inc. Method and apparatus for variable block size interpolative coding of images
US5446804A (en) 1994-04-14 1995-08-29 Hewlett-Packard Company Magnifying digital image using edge mapping
KR0174455B1 (ko) 1995-02-28 1999-03-20 배순훈 화소단위 움직임예측을 이용하는 영상신호 부호화 방법 및 장치
KR100242636B1 (ko) 1996-03-23 2000-02-01 윤종용 블록화효과 및 링잉노이즈 감소를 위한 신호적응후처리시스템
JP3477603B2 (ja) 1997-04-07 2003-12-10 株式会社日立製作所 画像処理方法、画像処理装置および画像処理プログラムを記録した記録媒体
JPH1169144A (ja) * 1997-08-12 1999-03-09 Sony Corp 画像信号の変換装置および変換方法
JP3868654B2 (ja) 1998-03-27 2007-01-17 株式会社リコー 画像処理装置
JP2001008037A (ja) 1999-06-23 2001-01-12 Nec Corp 画素補間方法および回路
US6421090B1 (en) * 1999-08-27 2002-07-16 Trident Microsystems, Inc. Motion and edge adaptive deinterlacing
US6842483B1 (en) 2000-09-11 2005-01-11 The Hong Kong University Of Science And Technology Device, method and digital video encoder for block-matching motion estimation
DE60238041D1 (de) * 2001-03-13 2010-12-02 Ecchandes Inc Visuelle einrichtung, verriegelnder zähler und bildsensor
US7764839B2 (en) * 2003-08-14 2010-07-27 Fujifilm Corporation Edge detecting apparatus and method, and image size enlarging and reducing apparatus and method
US7433535B2 (en) 2003-09-30 2008-10-07 Hewlett-Packard Development Company, L.P. Enhancing text-like edges in digital images
US7391920B2 (en) * 2003-11-04 2008-06-24 Fujifilm Corporation Image processing method, apparatus, and program
JP4414195B2 (ja) 2003-11-06 2010-02-10 富士フイルム株式会社 画像補間方法および装置並びにプログラム
KR100530224B1 (ko) 2004-04-20 2005-11-22 삼성전자주식회사 이미지 변환 장치 및 그 방법
KR100647284B1 (ko) 2004-05-21 2006-11-23 삼성전자주식회사 영상의 문자 추출 장치 및 방법
EP1631068A3 (en) * 2004-08-26 2008-09-03 Samsung Electronics Co., Ltd. Apparatus and method for converting interlaced image into progressive image
JP2008532083A (ja) * 2005-02-28 2008-08-14 エヌエックスピー ビー ヴィ 画像データをフレームメモリに一時的に記憶する新たな圧縮フォーマットを用いる新たな圧縮フォーマット及び装置
CN1892696B (zh) * 2005-07-08 2010-06-16 深圳迈瑞生物医疗电子股份有限公司 超声图像边缘锐化与斑点抑制方法
KR100754735B1 (ko) * 2006-02-08 2007-09-03 삼성전자주식회사 에지 신호 성분을 이용한 효율적인 영상 확대 방법 및 이를위한 장치
RU2310911C1 (ru) 2006-06-14 2007-11-20 Самсунг Электроникс Ко., Лтд. Способ интерполяции изображений
CN100511269C (zh) * 2006-06-26 2009-07-08 北京航空航天大学 一种基于角点引导的图像快速边缘匹配方法
CN101123682B (zh) * 2006-08-11 2011-06-22 松下电器产业株式会社 可减少图像振铃噪声的方法、装置及集成电路
JP3955910B2 (ja) * 2006-12-04 2007-08-08 国立大学法人九州工業大学 画像信号処理方法
KR101312260B1 (ko) * 2007-01-19 2013-09-25 삼성전자주식회사 에지 영역을 효과적으로 압축하고 복원하는 방법 및 장치
US8000535B2 (en) * 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
FR2921504B1 (fr) 2007-09-21 2010-02-12 Canon Kk Procede et dispositif d'interpolation spatiale
EP2046047A1 (en) 2007-10-04 2009-04-08 Thomson Licensing Method and device for performing motion estimation
CN101184233B (zh) * 2007-12-12 2010-06-02 中山大学 一种基于cfrfs数字视频压缩编码的方法
CN101267556B (zh) * 2008-03-21 2011-06-22 海信集团有限公司 快速运动估计方法及视频编解码方法
CN101261234B (zh) * 2008-03-26 2010-06-09 广州中国科学院工业技术研究院 表面缺陷检测装置
CN100574391C (zh) 2008-07-17 2009-12-23 友达光电股份有限公司 影像处理装置及影像数据内插方法
CN101431606A (zh) * 2008-12-01 2009-05-13 上海广电(集团)有限公司中央研究院 一种基于边缘检测的自适应降噪处理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003521163A (ja) * 2000-01-17 2003-07-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ テキスト改良

Also Published As

Publication number Publication date
JP2013501411A (ja) 2013-01-10
US20110026582A1 (en) 2011-02-03
EP2667605A3 (en) 2017-06-14
CN104486531A (zh) 2015-04-01
CN104469383A (zh) 2015-03-25
CN104539958A (zh) 2015-04-22
KR20120034821A (ko) 2012-04-12
EP2460356A2 (en) 2012-06-06
CN102484710B (zh) 2016-10-26
JP5539515B2 (ja) 2014-07-02
US9129409B2 (en) 2015-09-08
EP2667608A3 (en) 2017-06-21
EP2667606A1 (en) 2013-11-27
EP2667605A2 (en) 2013-11-27
KR101527554B1 (ko) 2015-06-10
WO2011014633A3 (en) 2011-05-05
WO2011014633A2 (en) 2011-02-03
KR20130119510A (ko) 2013-10-31
KR101452735B1 (ko) 2014-10-23
EP2667607A3 (en) 2014-09-10
CN102484710A (zh) 2012-05-30
KR101517802B1 (ko) 2015-05-06
KR101546864B1 (ko) 2015-08-24
KR20150116903A (ko) 2015-10-16
EP2667608A2 (en) 2013-11-27
EP2667607A2 (en) 2013-11-27
CN104469382A (zh) 2015-03-25
KR20130119511A (ko) 2013-10-31
JP2016006979A (ja) 2016-01-14
KR20130119509A (ko) 2013-10-31
KR20130119512A (ko) 2013-10-31
JP5976702B2 (ja) 2016-08-24

Similar Documents

Publication Publication Date Title
JP5976702B2 (ja) ビデオコンテンツを圧縮するシステム及び方法
WO2020097888A1 (zh) 视频处理方法、装置、电子设备及计算机可读存储介质
JP6102680B2 (ja) 符号化装置、復号装置、符号化データ、符号化方法、復号方法およびプログラム
KR20040006065A (ko) 장면전환검출장치 및 그 방법
CN104702955A (zh) 屏幕视频的预测编码的方法与系统
CN115988206B (zh) 图像处理方法、处理设备及存储介质
CN105491358A (zh) 一种图像处理方法及装置、终端
JP5503507B2 (ja) 文字領域検出装置およびそのプログラム
KR20210106547A (ko) 디코딩 예측 방법, 장치 및 컴퓨터 저장 매체
CN116668704A (zh) 处理方法、处理设备及存储介质
KR101930389B1 (ko) 동영상 압축방법, 장치 및 이에 대한 컴퓨터 프로그램
CN103442239A (zh) 一种适用于hevc标准的去方块滤波器的硬件片上存储方法
CN116847088B (zh) 图像处理方法、处理设备及存储介质
WO2024016775A1 (zh) 数据处理方法、装置、设备
CN117857808A (zh) 一种基于数据分类压缩的高效视频传输方法及系统
CN117176959A (zh) 处理方法、处理设备及存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150120

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20150420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160720

R150 Certificate of patent or registration of utility model

Ref document number: 5976702

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees