CN104469383A - 用于像素内插的系统及方法 - Google Patents

用于像素内插的系统及方法 Download PDF

Info

Publication number
CN104469383A
CN104469383A CN201410772702.1A CN201410772702A CN104469383A CN 104469383 A CN104469383 A CN 104469383A CN 201410772702 A CN201410772702 A CN 201410772702A CN 104469383 A CN104469383 A CN 104469383A
Authority
CN
China
Prior art keywords
pixel
value
pixels
edge
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410772702.1A
Other languages
English (en)
Inventor
胡迪特·马蒂内·包萨
斯雷尼瓦斯·瓦拉达拉扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104469383A publication Critical patent/CN104469383A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40093Modification of content of picture, e.g. retouching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Television Systems (AREA)

Abstract

本发明涉及用于像素内插的系统及方法。本发明揭示一种内插像素值的方法,且所述方法可包含定位缺漏像素。进一步来说,所述方法可包含确定多个最接近像素、确定用于所述多个最接近像素中的每一者的值,以及确定所述缺漏像素与所述多个最接近像素中的每一者之间的距离。所述方法还可包含将所述多个最接近像素中的每一者分类为边缘像素或非边缘像素,以及至少部分基于所述多个最接近像素中的每一者的所述值、所述缺漏像素与所述多个最接近像素中的每一者之间的所述距离以及对所述多个最接近像素中的每一者的分类来确定所述缺漏像素的值。

Description

用于像素内插的系统及方法
分案申请信息
本发明专利申请是申请日为2010年7月29日,申请号为201080038969.8,以及发明名称为“用于像素内插的系统及方法”的发明专利申请案的分案申请。
相关申请案
本申请案以全文引用的方式并入有与本申请案主张其优先权的第12/511,349号美国专利申请案在同一日期申请的标题为“压缩视频内容的系统及方法”的第12/511,329号共同待决美国专利申请案。
技术领域
背景技术
当外部显示器或投影仪使用无线链路连接到移动装置时,数据必须经由无线信道传送。如果信道的容量不够大而无法处理数据传送,那么源(即原始视频)可能会被压缩。由于无线电链路的物理层的技术限制(例如阻止信道用于最大容量的干扰),容量可能不够大。如果信道在其它装置之间共享,那么容量也可能会不够大。或者,如果为误差减轻或校正保留信道带宽的一部分,那么容量可能会不够大。当前的压缩方法具有各种限制。
因此,所需要的是用于压缩视频内容的改进的系统及方法。
发明内容
本发明揭示一种内插像素值的方法,且所述方法可包含定位缺漏像素、确定多个最接近像素、确定用于所述多个最接近像素中的每一者的值、确定缺漏像素与所述多个最接近像素中的每一者之间的距离、将所述多个最接近像素中的每一者分类为边缘像素或非边缘像素,以及至少部分基于所述多个最接近像素中的每一者的值、缺漏像素与所述多个最接近像素中的每一者之间的距离以及所述多个最接近像素中的每一者的分类来确定缺漏像素的值。
在一特定方面中,所述多个最接近像素可包含沿垂直轴的第一像素、沿垂直轴的第二像素、沿水平轴的第三像素以及沿水平轴的第四像素。缺漏像素与多个最接近像素中的每一者之间的距离可包含沿垂直轴的第一距离、沿垂直轴的第二距离、沿水平轴的第三距离以及沿水平轴的第四距离。进一步来说,沿垂直轴的第一像素可包含第一值,沿垂直轴的第二像素可包含第二值,沿水平轴的第三像素可包含第三值,且沿水平轴的第四像素可包含第四值。沿垂直轴的第一像素可包含第一分类,沿垂直轴的第二像素可包含第二分类,沿水平轴的第三像素可包含第三分类,且沿水平轴的第四像素可包含第四分类。
在此方面中,所述方法可进一步包含:在第一分类为边缘像素或非边缘像素的情况下,设置第一掩模等于零或一;在第二分类为边缘像素或非边缘像素的情况下,设置第二掩模等于零或一;在第三分类为边缘像素或非边缘像素的情况下,设置第三掩模等于零或一;以及在第四分类为边缘像素或非边缘像素的情况下,设置第四掩模等于零或一。所述方法还可包含确定垂直预测值,其中所述垂直预测值根据Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)确定,其中Vert_Pred为垂直预测值,LA为第一掩模,A为第一值,b为第二距离,LB为第二掩模,B为第二值且a为第一距离。此外,所述方法可包含确定水平预测值,其中所述水平预测值根据Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)确定,其中Horz_Pred为水平预测值,LC为第三掩模,C为第三值,d为第四距离,LD为第四掩模,D为第四值,以及c为第三距离。所述方法还可包含根据P=(Vert_Pred+Horz_Pred)/2确定用于缺漏像素的所内插值,其中Vert_Pred为垂直预测值,以及Horz_Pred为水平预测值。
进一步来说,在此方面,非边缘像素可为中点像素。可根据基础层位流、增强层位流或其组合获得中点像素。此外,多个最接近像素中的每一者的值可选自由以下各项组成的群组:亮度值、色密度值、对比度值或梯度值。
在另一方面中,本发明揭示一种解码器装置,且所述解码器装置可包含用于定位缺漏像素的装置、用于确定多个最接近像素的装置、用于确定用于所述多个最接近像素中的每一者的值的装置、用于确定缺漏像素与所述多个最接近像素中的每一者之间的距离的装置、用于将所述多个最接近像素中的每一者分类为边缘像素或非边缘像素的装置以及用于至少部分基于所述多个最接近像素中的每一者的值、缺漏像素与所述多个最接近像素中的每一者之间的距离以及所述多个最接近像素中的每一者的分类来确定缺漏像素的值的装置。
在此方面中,所述多个最接近像素可包含沿垂直轴的第一像素、沿垂直轴的第二像素、沿水平轴的第三像素以及沿水平轴的第四像素。缺漏像素与多个最接近像素中的每一者之间的距离可包含沿垂直轴的第一距离、沿垂直轴的第二距离、沿水平轴的第三距离以及沿水平轴的第四距离。进一步来说,沿垂直轴的第一像素可包含第一值,沿垂直轴的第二像素可包含第二值,沿水平轴的第三像素可包含第三值,且沿水平轴的第四像素可包含第四值。沿垂直轴的第一像素可包含第一分类,沿垂直轴的第二像素可包含第二分类,沿水平轴的第三像素可包含第三分类,且沿水平轴的第四像素可包含第四分类。
所述解码器装置还可包含:用于在第一分类为边缘像素或非边缘像素的情况下设置第一掩模等于零或一的装置、用于在第二分类为边缘像素或非边缘像素的情况下设置第二掩模等于零或一的装置、用于在第三分类为边缘像素或非边缘像素的情况下设置第三掩模等于零或一的装置以及用于在第四分类为边缘像素或非边缘像素的情况下设置第四掩模等于零或一的装置。进一步来说,所述解码器装置可包含用于确定垂直预测值的装置,其中所述垂直预测值根据Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)确定,其中Vert_Pred为垂直预测值,LA为第一掩模,A为第一值,b为第二距离,LB为第二掩模,B为第二值,以及a为第一距离。所述解码器装置可包含用于确定水平预测值的装置,其中所述水平预测值根据Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)确定,其中Horz_Pred为水平预测值,LC为第三掩模,C为第三值,d为第四距离,LD为第四掩模,D为第四值,且c为第三距离。所述解码器装置还可包含用于根据P=(Vert_Pred+Horz_Pred)/2确定用于缺漏像素的所内插值的装置,其中Vert_Pred为垂直预测值,且Horz_Pred为水平预测值。
在此方面中,非边缘像素可为中点像素。可根据基础层位流、增强层位流或其组合获得中点像素。此外,多个最接近像素中的每一者的值可选自由以下各项组成的群组:亮度值、色密度值、对比度值或梯度值。
在又一方面中,本发明揭示一种装置,且所述装置可包含处理器。所述处理器可操作以定位缺漏像素、确定多个最接近像素、确定用于所述多个最接近像素中的每一者的值、确定缺漏像素与所述多个最接近像素中的每一者之间的距离、将所述多个最接近像素中的每一者分类为边缘像素或非边缘像素,且至少部分基于所述多个最接近像素中的每一者的值、缺漏像素与所述多个最接近像素中的每一者之间的距离以及所述多个最接近像素中的每一者的分类来确定缺漏像素的值。
在此方面中,所述多个最接近像素可包含沿垂直轴的第一像素、沿垂直轴的第二像素、沿水平轴的第三像素以及沿水平轴的第四像素。缺漏像素与所述多个最接近像素中的每一者之间的距离可包含沿垂直轴的第一距离、沿垂直轴的第二距离、沿水平轴的第三距离以及沿水平轴的第四距离。进一步来说,沿垂直轴的第一像素可包含第一值,沿垂直轴的第二像素可包含第二值,沿水平轴的第三像素可包含第三值,且沿水平轴的第四像素可包含第四值。沿垂直轴的第一像素可包含第一分类,沿垂直轴的第二像素可包含第二分类,沿水平轴的第三像素可包含第三分类,且沿水平轴的第四像素可包含第四分类。
所述处理器可进一步操作以在第一分类为边缘像素或非边缘像素的情况下设置第一掩模等于零或一,在第二分类为边缘像素或非边缘像素的情况下设置第二掩模等于零或一,在第三分类为边缘像素或非边缘像素的情况下设置第三掩模等于零或一,且在第四分类为边缘像素或非边缘像素的情况下设置第四掩模等于零或一。所述处理器可操作以确定垂直预测值,其中所述垂直预测值根据Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)确定,其中Vert_Pred为垂直预测值,LA为第一掩模,A为第一值,b为第二距离,LB为第二掩模,B为第二值以及a为第一距离。所述处理器可操作以确定水平预测值,其中所述水平预测值根据Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)确定,其中Horz_Pred为水平预测值,LC为第三掩模,C为第三值,d为第四距离,LD为第四掩模,D为第四值,以及c为第三距离。此外,所述处理器可操作以根据P=(Vert_Pred+Horz_Pred)/2确定用于缺漏像素的所内插值,其中Vert_Pred为垂直预测值,且Horz_Pred为水平预测值。
在此方面中,非边缘像素可为中点像素。可根据基础层位流、增强层位流或其组合获得中点像素。此外,多个最接近像素中的每一者的值可选自由以下各项组成的群组:亮度值、色密度值、对比度值或梯度值。
在另一方面中,本发明揭示一种计算机程序产品,且所述计算机程序产品可包含计算机可读媒体。所述计算机可读媒体可包含用于定位缺漏像素的至少一个指令、用于确定多个最接近像素的至少一个指令、用于确定用于所述多个最接近像素中的每一者的值的至少一个指令、用于确定缺漏像素与所述多个最接近像素中的每一者之间的距离的至少一个指令、用于将所述多个最接近像素中的每一者分类为边缘像素或非边缘像素的至少一个指令以及用于至少部分基于所述多个最接近像素中的每一者的值、缺漏像素与所述多个最接近像素中的每一者之间的距离以及所述多个最接近像素中的每一者的分类来确定缺漏像素的值的至少一个指令。
在此方面中,所述多个最接近像素可包含沿垂直轴的第一像素、沿垂直轴的第二像素、沿水平轴的第三像素以及沿水平轴的第四像素。缺漏像素与所述多个最接近像素中的每一者之间的距离可包含沿垂直轴的第一距离、沿垂直轴的第二距离、沿水平轴的第三距离以及沿水平轴的第四距离。进一步来说,沿垂直轴的第一像素可包含第一值,沿垂直轴的第二像素可包含第二值,沿水平轴的第三像素可包含第三值,且沿水平轴的第四像素可包含第四值。沿垂直轴的第一像素可包含第一分类,沿垂直轴的第二像素可包含第二分类,沿水平轴的第三像素可包含第三分类,且沿水平轴的第四像素可包含第四分类。
所述计算机可读媒体可包含:用于在第一分类为边缘像素或非边缘像素的情况下设置第一掩模等于零或一的至少一个指令、用于在第二分类为边缘像素或非边缘像素设置第二掩模等于零或一的至少一个指令、用于在第三分类为边缘像素或非边缘像素的情况下设置第三掩模等于零或一的至少一个指令以及用于在第四分类为边缘像素或非边缘像素的情况下设置第四掩模等于零或一的至少一个指令。此外,所述计算机可读媒体可包含用于确定垂直预测值的至少一个指令,其中所述垂直预测值根据Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)确定,其中Vert_Pred为垂直预测值,LA为第一掩模,A为第一值,b为第二距离,LB为第二掩模,B为第二值且a为第一距离。而且,所述计算机可读媒体可包含用于确定水平预测值的至少一个指令,其中所述水平预测值根据Horz_Pred=(LC*C*d+LD*D*c)/(LD*c+LC*d)确定,其中Horz_Pred为垂直预测值,LC为第三掩模,C为第三值,d为第四距离,LD为第四掩模,D为第四值,以及c为第三距离。进一步来说,所述计算机可读媒体可包含用于根据P=(Vert_Pred+Horz_Pred)/2确定用于缺漏像素的所内插值的至少一个指令,其中Vert_Pred为垂直预测值,且Horz_Pred为水平预测值。
在此方面中,非边缘像素可为中点像素。可根据基础层位流、增强层位流或其组合获得中点像素。此外,多个最接近像素中的每一者的值可选自由以下各项组成的群组:亮度值、色密度值、对比度值或梯度值。
在又一方面中,本发明揭示一种选择性地细化图像隅角的方法,且所述方法可包含扫描图像的区,将所述区分类为含文本或不含文本,识别含文本区内的任何缺漏隅角以及将缺漏隅角添加到边缘图。进一步来说,所述方法可包含获得图像内的重叠像素块,以及绘制所述块中的像素的直方图(HistN),其中所述直方图包括多个柱(bin),且每一柱均对应于一个像素强度。所述方法还可包含使用BPR=Max(HistN)/Tot_Blk_Pix来确定背景像素比(BPR),其中Max(HistN)为直方图中像素的最大数目,且Tot_Blk_Pix为像素块中的像素的总数。所述方法可包含使用NC=Sum(HistN>Th1)来确定组件的数目(NC),其中NC为基于直方图超出第一阈值(Th1)的像素的数目。此外,所述方法可包含确定BPR是否大于第二阈值(Th2);确定NC是否小于第三阈值(Th3),以及在BPR大于Th2且NC小于Th3的情况下,将像素块分类为含文本区。
在此方面中,所述方法可包含对含文本区执行图案匹配。而且,所述方法可包含定位非边缘像素,考虑至少一个隅角位置中的非边缘像素,定位最接近所述至少一个隅角位置中的非边缘像素的多个水平像素,以及定位最接近所述至少一个隅角位置的非边缘像素的多个垂直像素。所述方法可包含确定所述多个水平像素和所述多个垂直像素中的任一者是否为边缘像素,以及在所述多个水平像素中的任一者和所述多个垂直像素中的任一者为边缘像素时,将所述非边缘像素标记为边缘像素。所述至少一个隅角位置可选自由以下各项组成的群组:左上隅角位置、右上隅角位置、左下隅角位置以及右下隅角位置。
在另一方面中,本发明揭示一种装置,且所述装置可包含用于扫描图像的区的装置、用于将所述区分类为含文本或不含文本的装置、用于识别含文本区内任何缺漏隅角的装置以及用于将缺漏隅角添加到边缘图的装置。进一步来说,所述装置可包含用于获得图像内的重叠像素块并绘制所述块中的像素的直方图(HistN)的装置,其中所述直方图包括多个柱,且每一柱均对应于一个像素强度。所述装置还可包含用于使用BPR=Max(HistN)/Tot_Blk_Pix来确定背景像素比(BPR)的装置,其中Max(HistN)为直方图中的像素的最大数目,且Tot_Blk_Pix为像素块中的像素的总数。所述装置可包含用于使用NC=Sum(HistN>Th1)来确定组件的数目(NC)的装置,其中NC为基于直方图超出第一阈值(Th1)的像素的数目。此外,所述装置可包含用于确定BPR是否大于第二阈值(Th2);确定NC是否小于第三阈值(Th3),以及在BPR大于Th2且NC小于Th3的情况下将像素块分类为含文本区的装置。
在此方面中,所述装置可包含用于对含文本区执行图案匹配的装置。而且,所述装置可包含用于定位非边缘像素的装置、用于考虑至少一个隅角位置中的非边缘像素的装置、用于定位最接近所述至少一个隅角位置中的非边缘像素的多个水平像素的装置以及用于定位最接近所述至少一个隅角位置中的非边缘像素的多个垂直像素的装置。所述装置可包含用于确定多个水平像素和多个垂直像素中的任一者是否为边缘像素的装置,以及用于在多个水平像素中的任一者和多个垂直像素中的任一者为边缘像素时将所述非边缘像素标记为边缘像素的装置。所述至少一个隅角位置可选自由以下各项组成的群组:左上隅角位置、右上隅角位置、左下隅角位置以及右下隅角位置。
在又一方面中,本发明揭示一种装置,且所述装置可包含处理器。所述处理器可操作以扫描图像的区,将所述区分类为含文本或不含文本,识别含文本区内的任何缺漏隅角,以及将缺漏隅角添加到边缘图。所述处理器还可操作以获得图像内的重叠像素块,且绘制所述块中的像素的直方图(HistN),其中所述直方图包括多个柱,且每一柱均对应于一个像素强度。进一步来说,所述处理器可操作以使用BPR=Max(HistN)/Tot_Blk_Pix来确定背景像素比(BPR),其中Max(HistN)为直方图中的像素的最大数目,且Tot_Blk_Pix为所述像素块中的像素的总数。所述处理器可操作以使用NC=Sum(HistN>Th1)来确定组件的数目(NC),其中NC为基于直方图超出第一阈值(Th1)的像素的数目。而且,所述处理器可操作以确定BPR是否大于第二阈值(Th2),确定NC是否小于第三阈值(Th3),且在BPR大于Th2且NC小于Th3的情况下,将所述像素块分类为含文本区。
在此方面中,所述处理器可操作以对含文本区执行图案匹配。所述处理器可操作以定位非边缘像素,考虑至少一个隅角位置中的非边缘像素,定位最接近所述至少一个隅角位置中的非边缘像素的多个水平像素以及定位最接近所述至少一个隅角位置中的非边缘像素的多个垂直像素。而且,所述处理器可操作以确定多个水平像素中的任一者和多个垂直像素中的任一者是否为边缘像素,且在多个水平像素中的任一者和多个垂直像素中的任一者为边缘像素时,将所述非边缘像素标记为边缘像素。所述至少一个隅角位置选自由以下各项组成的群组:左上隅角位置、右上隅角位置、左下隅角位置以及右下隅角位置。
在又一方面中,本发明揭示一种计算机程序产品,且所述计算机程序产品可包含计算机可读媒体。所述计算机可读媒体可包含扫描图像的区的至少一个指令、将所述区分类为含文本或不含文本的至少一个指令、识别含文本区内的任何缺漏隅角的至少一个指令以及将缺漏隅角添加到边缘图的至少一个指令。进一步来说,所述计算机可读媒体可包含获得图像内的重叠像素块且绘制所述块中的像素的直方图(HistN)的至少一个指令,其中所述直方图包括多个柱,且每一柱均对应于一个像素强度。所述计算机可读媒体还可包含使用BPR=Max(HistN)/Tot_Blk_Pix来确定背景像素比(BPR)的至少一个指令,其中Max(HistN)为直方图中的像素的最大数目,且Tot_Blk_Pix为所述像素块中的像素的总数。所述计算机可读媒体可包含使用NC=Sum(HistN>Th1)来确定组件的数目(NC)的至少一个指令,其中NC为基于直方图超出第一阈值(Th1)的像素的数目。此外,所述计算机可读媒体可包含至少一个指令,所述至少一个指令确定BPR是否大于第二阈值(Th2);确定NC是否小于第三阈值(Th3),以及在BPR大于Th2且NC小于Th3的情况下将像素块分类为含文本区。
在此方面中,所述计算机可读媒体可包含对含文本区执行图案匹配的至少一个指令。而且,所述计算机可读媒体可包含定位非边缘像素的至少一个指令、考虑至少一个隅角位置中的非边缘像素的至少一个指令、定位最接近所述至少一个隅角位置中的非边缘像素的多个水平像素的至少一个指令以及定位最接近所述至少一个隅角位置的非边缘像素的多个垂直像素的至少一个指令。所述计算机可读媒体可包含确定多个水平像素和多个垂直像素中的任一者是否为边缘像素的至少一个指令,以及在多个水平像素中的任一者和多个垂直像素中的任一者为边缘像素时,将非边缘像素标记为边缘像素的至少一个指令。所述至少一个隅角位置可选自由以下各项组成的群组:左上隅角位置、右上隅角位置、左下隅角位置以及右下隅角位置。
在另一方面中,本发明揭示一种边缘间/中点间预测的方法,且所述方法可包含接收前一帧数据、初始化搜索半径使其等于一、使用搜索半径围绕前一帧数据中的处于同一位置的点进行扫描以及确定是否找到参考点。前一帧数据和参考点可包含至少一个中点。而且,前一帧数据和参考点可包含至少一个边缘。
在此方面中,所述方法可包含:在找到参考点时,设置帧间预测值等于参考点的值。进一步来说,所述方法可包含:在未找到参考点时,将搜索半径增加一;以及确定搜索半径是否等于最大范围。所述方法还可包含:在搜索半径不等于最大范围时,使用搜索半径围绕前一帧数据中的处于同一位置的点进行扫描;确定是否找到参考点;以及在找到参考点时,设置帧间预测值等于参考点的值。所述方法可包含:在搜索半径等于最大范围时,设置帧间预测值等于预定默认值。所述预定默认值可为帧数据的值的范围中的中间值。
在另一方面,本发明揭示一种装置,且所述装置可包含用于接收前一帧数据的装置、用于初始化搜索半径使其等于一的装置、用于使用搜索半径围绕前一帧数据中的处于同一位置的点进行扫描的装置以及用于确定是否找到参考点的装置。前一帧数据和参考点可包含至少一个中点。而且,前一帧数据和参考点可包含至少一个边缘。
在此方面中,所述装置可包含用于在找到参考点时设置帧间预测值等于参考点的值的装置。进一步来说,所述装置可包含用于在未找到参考点时将搜索半径增加一且确定搜索半径是否等于最大范围的装置。所述装置还可包含:用于在搜索半径不等于最大范围时使用所述搜索半径围绕前一帧数据中处于同一位置的点进行扫描的装置、用于确定是否找到参考点的装置、以及用于在找到参考点时设置帧间预测值等于参考点的值的装置。所述装置可包含用于在搜索半径等于最大范围时设置帧间预测值等于预定默认值的装置。所述预定默认值可为帧数据的值的范围中的中间值。
在又一方面中,本发明揭示一种装置,且所述装置可包含处理器。所述处理器可操作以接收前一帧数据、初始化搜索半径使其等于一、使用所述搜索半径围绕前一帧数据中的处于同一位置的点进行扫描以及确定是否找到参考点。前一帧数据和参考点可包含至少一个中点。进一步来说,前一帧数据和参考点可包含至少一个边缘。
在此方面中,所述处理器可操作以在找到参考点时设置帧间预测值等于参考点的值。所述处理器还可操作以在未找到参考点时将搜索半径增加一,并确定搜索半径是否等于最大范围。进一步来说,所述处理器可操作以在搜索半径不等于最大范围时,使用搜索半径围绕前一帧数据中处于同一位置的点进行扫描、确定是否找到参考点,以及在找到参考点时设置帧间预测值等于参考点的值。所述处理器可操作以在搜索半径等于最大范围时设置帧间预测值等于预定默认值。所述预定默认值可为帧数据的值的范围中的中间值。
在另一方面中,本发明揭示一种计算机程序产品,且所述计算机程序产品可包含计算机可读媒体。所述计算机可读媒体可包含用于接收前一帧数据的至少一个指令、用于初始化搜索半径使其等于一的至少一个指令、用于使用搜索半径围绕前一帧数据中处于同一位置的点进行扫描的至少一个指令以及用于确定是否找到参考点的至少一个指令。前一帧数据和参考点可包含至少一个中点。而且,前一帧数据和参考点可包含至少一个边缘。
在此方面中,所述计算机可读媒体可包含用于在找到参考点时设置帧间预测值等于参考点的值的至少一个指令。进一步来说,所述计算机可读媒体可包含用于在未找到参考点时将搜索半径增加一以及确定搜索半径是否等于最大范围的至少一个指令。所述计算机可读媒体还可包含用于在搜索半径不等于最大范围时使用搜索半径围绕前一帧数据中处于同一位置的点进行扫描的至少一个指令、用于确定是否找到参考点的至少一个指令、以及用于在找到参考点时设置帧间预测值等于参考点的值的至少一个指令。所述计算机可读媒体可包含用于在搜索半径等于最大范围时设置帧间预测值等于预定默认值的至少一个指令。所述预定默认值可为帧数据的值的范围中的中间值。
在又一方面中,本发明揭示边缘内/中点内预测的方法,且所述方法可包含确定多个所发送像素、将图像划分为具有预定大小的多个像素块以及确定每一像素块内的任何像素是否在所述多个所发送像素内。所述多个所发送像素可包含多个边缘像素和多个中点像素。所述预定大小可设置为等于上次反复中的比例因子。
在此方面中,所述方法可包含:在像素块内的像素均不在所述多个所发送像素内时,设置预测值等于预定默认值。所述方法还可包含设置预测值等于像素块内所有所发送像素值的均值。进一步来说,所述方法可包含确定未发送像素的残数。所述未发送像素的残数可包含实际值减去预测值。
在另一方面中,本发明揭示一种装置,且所述装置可包含用于确定多个所发送像素的装置、用于将图像划分为具有预定大小的多个像素块的装置以及用于确定每一像素块内的任何像素是否在多个所发送像素内的装置。所述多个所发送像素可包含多个边缘像素和多个中点像素。所述预定大小可设置为等于上次反复中的比例因子。
在此方面中,所述装置可包含用于在像素块内的像素均不在所述多个所发送像素内时设置预测值等于预定默认值的装置。所述装置还可包含用于设置预测值等于像素块内所有所发送像素值的均值的装置。进一步来说,所述装置可包含用于确定未发送像素的残数的装置。所述未发送像素的残数可包含实际值减去预测值。
在又一方面中,本发明揭示一种装置,且所述装置可包含处理器。所述处理器可操作以确定多个所发送像素、将图像划分为具有预定大小的多个像素块,且确定每一像素块内的任何像素是否在多个所发送像素内。所述多个所发送像素可包含多个边缘像素和多个中点像素。所述预定大小可设置为等于上次反复中的比例因子。
在此方面中,所述处理器可操作以在像素块内的像素均不在所述多个所发送像素内时,设置预测值等于预定默认值。所述处理器还可操作以设置预测值等于像素块内所有所发送像素值的均值。进一步来说,所述处理器可操作以确定未发送像素的残数。所述未发送像素的残数可包含实际值减去预测值。
在另一方面中,本发明揭示一种计算机程序产品,且所述计算机程序产品可包含计算机可读媒体。所述计算机可读媒体可包含用于确定多个所发送像素的至少一个指令、用于将图像划分为具有预定大小的多个像素块的至少一个指令以及用于确定每一像素块内的任何像素是否在多个所发送像素内的至少一个指令。所述多个所发送像素可包含多个边缘像素和多个中点像素。所述预定大小可设置为等于上次反复中的比例因子。
在此方面中,所述计算机可读媒体可包含用于在像素块内的像素均不在多个所发送像素内时设置预测值等于预定默认值的至少一个指令。所述计算机可读媒体还可包含用于设置预测值等于像素块内所有所发送像素值的均值的至少一个指令。进一步来说,所述计算机可读媒体可包含用于确定未发送像素的残数的至少一个指令。所述未发送像素的残数可包含实际值减去预测值。
在又一方面中,本发明揭示一种细化中点的方法,且所述方法可包含接收多个中点、使用来自多个中点像素中的每一者的预定步长角沿预定数目的方向对多个像素进行扫描、确定当前像素位置是否大于最大扫描距离以及在当前像素位置并不大于最大扫描距离的情况下确定当前像素是否为边缘像素。所述方法还可包含在当前像素不是边缘像素的情况下确定当前像素是否为中点像素,以及在当前像素是中点像素时从中点图中移除当前像素。所述预定数目的方向可包含八个方向。所述预定步长角可为四十五度(45°)。
在又一方面中,本发明揭示一种装置,且所述装置可包含用于接收多个中点的装置、用于使用来自所述多个中点像素中的每一者的预定步长角沿预定数目的方向对多个像素进行扫描的装置、用于确定当前像素位置是否大于最大扫描距离的装置以及用于在当前像素位置并不大于最大扫描距离的情况下确定当前像素是否为边缘像素的装置。所述装置还可包含用于在当前像素不是边缘像素的情况下确定当前像素是否为中点像素且在当前像素为中点像素时从中点图中移除当前像素的装置。所述预定数目的方向可包含八个方向。所述预定步长角可为四十五度(45°)。
在又一方面中,本发明揭示一种装置,且所述装置可包含处理器。所述处理器可操作以接收多个中点、使用来自多个中点像素中的每一者的预定步长角沿预定数目的方向对多个像素进行扫描、确定当前像素位置是否大于最大扫描距离,且在当前像素位置并不大于最大扫描距离的情况下确定当前像素是否为边缘像素。进一步来说,所述处理器可操作以在当前像素不是边缘像素的情况下确定当前像素是否为中点像素,且在当前像素是中点像素时,从中点图中移除当前像素。所述预定数目的方向可包含八个方向。所述预定步长角可为四十五度(45°)。
在又一方面中,本发明揭示一种计算机程序产品,且所述计算机程序产品可包含计算机可读媒体。所述计算机可读媒体可包含用于接收多个中点的至少一个指令、用于使用来自所述多个中点像素中的每一者的预定步长角沿预定数目的方向对多个像素进行扫描的至少一个指令、用于确定当前像素位置是否大于最大扫描距离的至少一个指令,以及用于在当前像素位置并不大于最大扫描距离的情况下确定当前像素是否为边缘像素的至少一个指令。所述计算机可读媒体还可包含用于在当前像素不是边缘像素的情况下确定当前像素是否为中点像素且在当前像素是中点像素时从中点图中移除当前像素的至少一个指令。所述预定数目的方向可包含八个方向。所述预定步长角可为四十五度(45°)。
附图说明
在图中,各图中相同参考标号始终指代相同部分,除非另有指示。
图1是无线系统的图;
图2是电话的图;
图3是展示说明压缩图形内容和视频内容以供经由无线链路发射的方法的流程图;
图4是说明检测图像边缘的方法的流程图;
图5是说明选择性地细化图像隅角的方法的第一方面的流程图;
图6是说明选择性地细化图像隅角的方法的第二方面的流程图;
图7是说明图案匹配的方法的流程图;
图8是说明文本块隅角的图;
图9是说明游程长度编码的方法的流程图;
图10是说明获得图像中点的方法的流程图;
图11是说明细化中点的方法的流程图;
图12是说明多个像素的图;
图13是说明恢复中点的方法的流程图;
图14是说明边缘间/中点间预测的方法的流程图;
图15是说明多个像素的图;
图16是说明对水平和垂直中点进行编码的方法的流程图;
图17是说明针对未发送像素的边缘内/中点内预测的方法的流程图;
图18是说明内插像素值的方法的第一方面的流程图;
图19是说明内插像素值的方法的第二方面的流程图;以及
图20是多个像素的表示。
具体实施方式
词语“示范性”在本文中用于表示“充当实例、例子或说明”。不一定将本文中描述为“示范性”的任何方面解释为与其它方面相比为优选或有利的。
在此描述中,术语“应用程序”还可包含具有可执行内容的文件,所述可执行内容例如是:目标代码、脚本、字节代码、标记语言文件及补丁。另外,本文中所提到的“应用程序”还可包括本质上不可执行的文件,例如可能需要打开的文档或其它需要存取的数据文件。
术语“内容”还可包含具有可执行内容的文件,所述可执行内容例如是:目标代码、脚本、字节代码、标记语言文件及补丁。另外,本文中所提到的任何“内容”还可包括本质上不可执行的文件,例如可能需要打开的文档或其它需要存取的数据文件。
在此描述中,术语“通信装置”、“无线装置”、“无线电话”、“无线通信装置”及“无线手持机”可互换使用。随着第三代(3G)无线技术的出现,更大的带宽可用性已实现具有无线能力的更多电子装置。因此,无线装置可为蜂窝式电话、寻呼机、PDA、智能电话、导航装置或具有无线连接的计算机。
最初参看图1,展示无线移动数字显示接口(WMDDI)系统,且概括表示为100。如图所示,WMDDI系统100包含主机装置102及客户端装置104。主机装置102及客户端装置104可经由无线链路106连接。在特定方面中,主机装置可为移动装置,例如蜂窝式电话、移动电话、便携式数据助理(PDA)或某一其它手持式无线装置。进一步来说,客户端装置104可为具有嵌入式能力(例如音频/视频解码、HID或其组合)的无线显示器。举例来说,客户端装置104可为外部显示器、投影仪或某一其它类似装置。无线链路106可为WMDDI。
在特定方面中,主机装置102和客户端装置104可能能够建立关联,且使用WMDDI协议来使用于多媒体内容和控制消息交换的通信安全。在一个方面中,就可沿前向链路(即,从主机装置102到客户端装置104)交换较大量数据来说,所述通信可能是不对称的。
在特定方面中,主机装置102可包含可提供多媒体内容的若干应用程序。举例来说,主机装置102可包含可从文件中解码经压缩的视频和音频位流的媒体播放器。主机装置102还可包含可处理图形命令以渲染图像内容的一个或一个以上视频游戏。进一步来说,主机装置102可包含相机,例如电荷耦合装置(CCD)相机、互补金属氧化物半导体(CMOS)相机或某一其它相机,所述相机可用以流式传输捕捉到的红/绿/蓝(RGB)图像。这些应用程序中的每一者以及产生图像内容的其它应用程序可向主机装置102上的内部显示器提供原始视频(例如RGB或Cr/Cb/Y),主机装置102的分辨率和位深度与内部显示器的分辨率和位深度匹配。内部显示器可为液晶显示器(LCD)或某一其它显示器。在下文的表1中展示常用显示分辨率和帧速率下用于原始视频内容(例如RGB)的位速率。
表1.用于常用显示分辨率和帧速率的RGB位速率。
视频序列(24bpp) 位速率
QVGA(320x240),30fps 55.3Mbps
VGA(640x480),30fps 221.2Mbps
WVGA(864x480),30fps 298.6Mbps
HDTV(1080x1920,30fps 1.5Gbps
当使用无线链路106将客户端装置104连接到主机装置102时,从主机装置102传送到客户端装置104的数据可经由无线信道传送。如果无线信道的容量不够大,那么可压缩原始视频数据。无线信道的容量由于无线信道的物理层的技术限制、由于无线信道在其它装置之间共享、由于信道的某一裕量为误差减轻技术或校正技术而保留,或其组合而可能不充足。
无线链路106可能并不提供固定的容量。因此,经由无线链路106的视频发射可适应不同的信道条件。
参看图2,展示无线电话的示范性非限制方面,且概括表示为220。如图所示,无线装置220包含芯片上系统222,芯片上系统222包含耦合在一起的数字信号处理器224及模拟信号处理器226。如图2中所说明,显示控制器228及触摸屏控制器230耦合到数字信号处理器224。处于芯片上系统222外部的触摸屏显示器232又耦合到显示器控制器228和触摸屏控制器230。
图2进一步指示视频编码器234(例如,逐行倒相制式(PAL)编码器、顺序色彩与存储制式(SECAM)编码器或美国国家电视系统委员会制式(NTSC)编码器)耦合到数字信号处理器224。进一步来说,视频放大器236耦合到视频编码器234和触摸屏显示器232。而且,视频端口238耦合到视频放大器236。如图2中所描绘,通用串行总线(USB)控制器240耦合到数字信号处理器224。而且,USB端口242耦合到USB控制器240。存储器244及订户身份模块(SIM)卡246也可耦合到数字信号处理器224。进一步来说,如图2中所示,数码相机248可耦合到数字信号处理器224。在示范性方面中,数码相机248是电荷耦合装置(CCD)相机或互补金属氧化物半导体(CMOS)相机。
如图2中进一步说明,立体声音频编解码器(CODEC)250可耦合到模拟信号处理器226。此外,音频放大器252可耦合到立体声音频CODEC 250。在示范性方面中,第一立体声扬声器254及第二立体声扬声器256耦合到音频放大器252。图2表明麦克风放大器258也可耦合到立体声音频CODEC 250。另外,麦克风260可耦合到麦克风放大器258。在特定方面中,调频(FM)无线电调谐器262可耦合到立体声音频CODEC 250。而且,FM天线264耦合到FM无线电调谐器262。此外,立体声耳机266可耦合到立体声音频CODEC 250。
图2进一步表明射频(RF)收发器268可耦合到模拟信号处理器226。RF开关270可耦合到RF收发器268及RF天线272。如图2中所示,小键盘274可耦合到模拟信号处理器226。而且,具有麦克风的单声道头戴耳机276可耦合到模拟信号处理器226。进一步来说,振动器装置278可耦合到模拟信号处理器226。图2还表明电源280可耦合到芯片上系统222。在特定方面中,电源280是直流(DC)电源,其将电力提供给无线装置220的需要电力的各个组件。进一步来说,在特定方面中,电源是可再充电DC电池或从连接到AC电源的交流(AC)到DC变压器得到的DC电源。
如图2中所描绘,触摸屏显示器232、视频端口238、USB端口242、相机248、第一立体声扬声器254、第二立体声扬声器256、麦克风260、FM天线264、立体声耳机266、RF开关270、RF天线272、小键盘274、单声道头戴耳机276、振动器278及电源280在芯片上系统222外部。
在特定方面中,本文中所述的方法中的一者或一者以上可作为计算机程序指令存储于存储器244中。这些指令可由处理器224、226执行,以便实施本文中所述的方法。进一步来说,处理器224、226、存储器244、存储于其中的指令或其组合可充当用于执行本文中所述的方法中的一者或一者以上的装置。
现在参看图3,展示对用于经由无线链路发射的图形内容和视频内容进行压缩的方法且概括表示为300。在框302处开始,可至少部分基于高斯西格玛值306、边缘值的百分比308以及低阈值与高阈值比310对多个像素304执行边缘检测。在框312处,可对像素304以及在框302处创建的边缘图314执行选择性隅角细化。移到框317,可对在框308处创建的经细化边缘图316执行游程长度编码。此后,在框318处,可对经游程长度编码的数据执行算术编码。在特定方面中,经细化边缘图316可存储在当前帧数据(CFD)缓冲器320中以留做以后使用(如本文中所述)。
进行到框322,可从经细化边缘图316中获得中点以创建中点图324。此后,可在框326处至少部分基于经细化边缘图316而细化中点图324内的中点。在框328处,可从经细化边缘图316中获得边缘值330。这些边缘值可存储在CFD缓冲器320中。
移到框332,可基于经细化边缘图316、中点图324、像素304以及在框326处创建的经细化中点图334而恢复中点。在框336处,可对像素304以及从PFD缓冲器338接收到的前一帧数据(PFD)执行帧间预测。帧间预测法的结果可包含边缘残数340和中点残数342,且可在框318处对边缘残数340和中点残数342执行算术编码。可对多个帧执行帧间预测。
在框344处,可基于中点图324、经细化边缘图316、像素304或其组合对水平和垂直中点进行编码。水平和垂直中点编码可多次反复执行。此编码步骤的结果可包含中点残数346,且可在框318处对中点残数346执行算术编码。进一步来说,可将中点图348输出到CFD缓冲器320。
移到框350,可至少部分基于像素304、CFD缓冲器320内的当前帧数据、中点图348、边缘图314或其组合执行对未发送像素的帧内预测。在执行帧内预测后,可考虑编码为无损的。帧内预测的结果可包含无损像素残数,可在框318处对其执行算术编码。如图所示,图3中所示方法的输出可为位流354。
图4说明检测图像边缘的方法,概括表示为400。在框402处开始,编码器可使用高斯西格玛符号404来构造高斯掩模。在框406处,所述编码器可使用多个像素408来修匀图像。移到框410,所述编码器可计算水平梯度、垂直梯度以及梯度量值(MG)。
在框412处,所述编码器可绘制MG的直方图,且至少部分基于边缘414的百分比获得高阈值(“高Th”)。此后,在框416处,所述编码器可确定低阈值(“低Th”)。所述编码器可基于等于低Th/高Th的阈值比418确定低Th。在框420处,所述编码器可执行非最大抑制。在框422处,所述编码器可执行滞后阈值化。此后,在框424处,所述编码器可输出边缘图。
图5说明选择性地细化图像隅角的方法的第一方面。在框502处开始,可对区进行扫描。在框504处,可将所述区分类为含文本或不含文本。在决策506处,可确定所述区是含文本还是不含文本。如果所述区为含文本,那么方法500可继续到框508,且可识别含文本区内的缺漏隅角。接着,在框510处,可将缺漏隅角添加到边缘图。
移到决策512,可确定另一区是否可用于扫描。如果是,那么方法500可返回到框502且如本文所述而继续。否则,方法500可移到框514,且可发射经细化边缘图。接着,方法500可结束。在返回到决策506的情况下,如果所述区为非文本,那么方法500可直接进行到决策512且如本文所述而继续。
现在参看图6,展示选择性地细化图像隅角的方法的第二方面,且概括表示为600。在框602处开始,编码器可获得重叠像素块604。可将图像的每一帧划分为正方形像素块。每一正方形的大小可具有与基本大小(Basic_Size)与图案匹配块大小(Pattern_Matching_Block_Size)的两倍之和相等的尺寸。换句话说,每一正方形的尺寸可使用以下公式确定:
Size=Basic_Size+2*Pattern_Matching_Block_Size
进一步来说,接界的Pattern_Matching_Block_Size像素可与邻近像素块重叠。
在框606处,编码器可获得框中像素的直方图(HistN),且绘制直方图以使得直方图中的每一柱均对应于一个像素强度。在框608处,背景像素比(BPR)可使用以下公式确定:
BPR=Max(HistN)/Tot_Blk_Pix
其中:
Max(HistN)=直方图中像素的最大数目;
Tot_Blk_Pix=像素块中的像素的总数。
在框608处,组件的数目(NC)也可使用以下公式确定:
NC=Sum(HistN>Th1)
组件的数目可表示基于直方图具体值超出第一阈值(Th1)的像素的数目。
移到决策步骤610,编码器可确定BPR是否大于第二阈值(Th2),以及NC是否小于第三阈值(Th3)。如果是,那么可将像素块分类为文本块,且方法600可进行到框612,且对于边缘图614中的每个非边缘像素来说,可执行图案匹配。而且,在框612处,对于每个已找到的匹配来说,可将新的边缘插入到边缘图中以创建经细化边缘图。在框616处,编码器可输出经细化边缘图。此后,方法600可结束。返回到决策610,如果条件未满足,那么可将像素块分类为非文本块,且方法600可结束。在特定方面中,第二阈值(Th2)和第三阈值(Th3)可为基于直方图的预设值。
图7是说明图案匹配的方法(其概括表示为700)的流程图。图8是说明可在图7中所示方法700的描述期间提到的文本块隅角的图。
框702处开始,对于文本块中每一非边缘像素P来说,可执行以下步骤。在框704处,可将P可视为好像处于隅角位置(例如左上隅角、右上隅角、左下隅角或右下隅角)。在框706处,可定位最接近的三(3)个水平像素。在框708处,可定位最接近的三(3)个垂直像素。在特定方面中,三(3)为选定的Pattern_Matching_Block_Size。
移到决策710,编码器可确定最接近的三(3)个水平像素中的任一者和最接近的三(3)个垂直像素中的任一者是否是边缘。如果是,那么方法700可移到框712,且可将像素P标记为边缘。此后,在决策714处,编码器可确定另一像素是否可用于图案匹配。如果是,那么方法700可返回到框704,且如本文所述而继续。否则,方法700可结束。
返回到决策步骤710,如果最接近的六个像素均不为边缘,那么方法700可移到决策716,且编码器可确定是否在所有四个隅角中对像素P进行测试。如果否,那么方法700可进行到框718,且可将像素P移到下一隅角位置。如果在所有隅角位置中对像素P进行测试,那么方法700可继续到决策714且如本文所述而继续。
在特定方面中,图6和图7中所示的方法600、700可用以通过将缺漏隅角包含在含有文本的区中来细化边缘图。这些方法600、700可局部性地将区分类为含文本或不含文本。这可基于亮度的局部直方图来确定。方法600中的决策可基于亮度直方图中的预定义阈值(即,Th1、Th2和Th3)。进一步来说,方法600、700可选择可能含有缺漏隅角的含文本区中的区域。可在初始边缘图上使用图案匹配来选择这些区域。对于选定区域来说,可将缺漏隅角添加到边缘图。
很多众所周知的边缘检测可能无法检测图像的文本部分中的隅角,其中所述图像梯度并不坚定地沿水平或垂直方向定向。很多边缘像素可能并未得到检测,且致使来自一个区的中点用于另一区中的内插并引起拖尾假影。结合图6和图7描述的隅角细化法使用图案匹配来预测未检测边缘(例如隅角)的位置,且在边缘图中引入新的边缘。由于此举可能会导致大量新的边缘产生,且由此为非文本区引入较高的位速率,因此可包含预处理步骤(步骤602到510)以便将帧分类成文本或非文本区的块。接着,将隅角细化选择性地应用于图像的文本区。
对于类似的位速率发射,图6和图7中所示的方法600、700可使像素信噪比(PSNR)改进大约五到八分贝(5到8dB)。进一步来说,当这些方法600、700利用可使用逐位运算符优化的简单图案匹配时,它们相对来说计算成本较小。可消除对精心设计的梯度计算方法(例如哈里斯(Harris)隅角检测器)的需要。
图9说明游程长度编码的方法(其概括表示为900)。在特定方面中,可对可输入到编码器的经细化边缘图902执行方法900。进一步来说,在执行游程长度编码的过程中,方法900可利用一个或一个以上像素位置904。
框906处开始,编码器可对经细化边缘图902进行光栅扫描,直到找到下一个边缘为止。到边缘的像素计数可记录为“Run(游程)”。在决策步骤908处,编码器可确定Run值是否大于Max_Run(最大_游程)值。如果否,那么可将Run值放入输入缓冲器中用于算术编码。接着,方法900可结束。返回到决策908,如果Run值大于Max_Run值,那么可将Max_Run值放入输入缓冲器中“N”次,其中N=ceil(Run/Max_Run),且ceil()取最大整数,使得N<=Run/Max_Run,随后获得值为Run=Run%Max_Run。接着,方法900可结束。
参看图10,展示获得帧内图像中点的方法,且其概括表示为1000。可通过编码器对具有多个行1004和多个列1006的经细化边缘图1002执行图10的方法1000。进一步来说,可对每一行1004和每一列1006执行方法1000。
在框1008处开始,编码器可从当前位置(Curr_Pos)开始沿当前行(Curr_Row)进行扫描,直到在新位置(New_Pos)处找到边缘、中点或边界为止。在框1010处,将中点界定为当前位置加上新位置除以二,即中点=(Curr_Pos+New_Pos)/2。进一步来说,在框1010处,将当前位置设置为等于新位置,即Curr_Pos=New_Pos。在框1012处,可输出多个水平中点。
在框1014处,编码器可从当前位置(Curr_Pos)开始沿当前列(Curr_Col)进行扫描,直到在新位置(New_Pos)处找到边缘、中点或边界为止。在框1016处,将中点界定为当前位置加上新位置除以二,即中点=(Curr_Pos+New_Pos)/2。进一步来说,在框1016处,将当前位置设置为等于新位置,即Curr_Pos=New_Pos。在框1018处,可输出多个垂直中点。接着,方法1000可结束。
图11说明细化中点的方法,概括表示为1100。可使用多个中点1102和多个中点位置1104来执行方法1100。在框1106处开始,编码器可从每个中点开始,沿八(8)个方向以四十五度(45°)为步长进行扫描,且对于每个扫描方向来说,Max_Scan_Distance(最大_扫描_距离)位置最大,如图12中所示。
移到决策1108,编码器可确定当前像素位置是否大于Max_Scan_Distance。如果是,那么方法1100可进行到决策1110,且所述编码器可确定是否对所有八(8)个方向进行了扫描。如果否,那么方法1100可进行到框1112,且编码器可进行到其它下一扫描方向。接着,方法1100可返回到框1106且如本文所述而继续。
返回到决策1110,如果对所有八(8)个方向进行了扫描,那么方法1100可进行到决策1114,且编码器可确定是否已对最后一个中点进行了扫描。如果否,那么方法1100可进行到框1116,且编码器可移到下一中点。此后,方法1100可返回到框1106且如本文所述而继续。否则,在决策1114处,如果编码器已围绕所述最后一个中点进行了扫描,那么方法1100可进行到框1118,且编码器可输出多个经细化中点。接着,方法1100可结束。
返回到决策1108,如果当前像素位置并不大于Max_Scan_Distance,那么所述方法可进行到决策1120,且编码器可确定当前像素是否为边缘。如果是,那么方法1100可返回到决策1110且如本文所述而继续。如果当前中点不是边缘,那么方法1100可进行到1122,且编码器可确定当前像素是否为中点。如果否,那么方法1100可进行到框1124,且编码器可沿扫描方向移到下一像素。在决策1122处,如果当前像素为中点,那么方法1100可进行到框1126,且可从中点图中移除当前中点。在如图11中所述对所有中点进行处理后,可输出多个经细化中点1112,且方法1100可结束。
可参考图12进一步阐释图11中所示的方法1100,从中点(扫描中心)开始,可沿图12中所示的八(8)条线中的每一者,以四十五度(45°)为步长对五×五块中的中点周围的相邻像素进行扫描。可消除相邻中点,直到遇到边缘像素或到达块的端部为止。在图12所示的实例中,像素M0可充当扫描中心,且由于细化的结果可消除中点M1、M2和M4。像素M5和M6由于它们横跨边缘因此可能不会被消除,且它们的值可能与像素M0的值有很明显的不同。
在特定方面中,图11中所示的方法1100可用以减少初始反复中编码的中点量,而不会显著降低重构的质量。由于进一步反复可为图像帧添加进一步细节,这可能会导致图像帧的质量较好,因此方法1100可被认为是可按比例缩放编码法的一部分。进一步来说,与针对同一位速率的其它方法相比,方法1100可提供大体上较好的图像质量。
在帧数据的编码期间,将两个边缘之间沿水平方向或沿垂直方向中心处的像素编码为中点。由于图像中边缘的性质,图像中的很多均匀区均可包含高密度的中点。额外的中点(即样本)可能是不必要的,且可能不会导致图像质量有显著的改进。图11中所示的方法1100可用以消除不必要的中点,且阻止对所述中点的编码。由于线性预测可假设在上次反复中沿垂直和水平方向编码的每两个边缘之间存在中点,因此可能需要从相邻中点中恢复被消除的中点。可将这些中点视为界标点,且可能需要恢复这些界标点。
图13说明恢复中点的方法,其概括表示为1300。可使用经细化边缘图1302、多个像素1304、中点图1306、经细化中点图1308或其组合执行图13的方法1300。
在框1310处开始,可通过那些中点来确定界标点集,所述中点为中点集的一部分而不是经细化中点集的一部分,即{界标点}={中点}-{经细化中点}。在框1312处,编码器可从每个中点开始,沿八(8)个方向,以四十五度(45°)为步长进行扫描。在决策1314处,编码器可确定当前帧是否为界标点。如果是,那么方法1300可进行到1316,且编码器可用中点值填充当前像素。接着,方法1300可结束,且可输出已恢复的中点图。
返回到决策1314,如果当前像素不是界标点,那么方法1300可继续到决策1318。在决策1318处,编码器可确定当前像素是否为边缘。如果否,那么方法1300可返回到框1312且如本文所述而继续。否则,方法1300可结束,且可输出已恢复的中点图。
使用图13中所述的方法1300,可首先计算界标点(即已消除的中点)的位置。接着,可用中点(其处于扫描中心,例如图12中的像素M0)的值来填充这些位置的值。由于解码器并不具有这些像素,因此这对确保既沿水平方向又沿垂直方向的每两个边缘之间存在中点来说可能是有用的。由于界标像素(或界标点)可充当预测值,因此它们在编码器和解码器处应是同一的。因此,可在编码器和解码器处执行图13中所示的恢复法1300。
图11和图13中所示的方法1100、1300可用以通过消除不必要的中点而不遭受图像质量的显著损失来降低数据速率。这些方法1100、1300可依靠边缘信息来保存对象边界上的中点。进一步来说,方法1100,1300相对较简单,且可在同一扫描程序后进行编码器处的消除(方法1100)以及解码器处的恢复(1200)。
参看图14,展示说明边缘间/中点间预测的方法的流程图,且概括表示为1400。可对多个帧每次一个帧数执行方法1400。进一步来说,方法1400可利用前一帧数据(PFD)1402和多个像素1404(例如,边缘像素、中点像素或其组合)。为清楚起见,在对图14中所示的方法1400的描述期间,可参考图15。
在框1406处开始,可将搜索半径r初始化为具有值一(1)。在框1408处,编码器可在半径r周围的前一帧中,围绕处于同一位置的点进行扫描。更具体来说,可在围绕图15中的中心像素(即像素1)的正方形区中执行所述扫描。在第一反复期间,可从像素2到像素8执行所述扫描。
在决策1410处,编码器可确定在所述第一扫描反复期间是否找到参考点(RefPt)。如果是,那么方法1400可继续到框1412,且将经帧间预测的值设置为与所述参考点值相等。接着,方法1400可结束。在决策1410处,如果未找到参考点,那么方法1400可继续到框1414,且搜索半径r的值可增加一(1)个单位(即,一(1)个像素)。
此后,在决策1416处,编码器可确定搜索半径r是否大于最大值(MaxRange(最大范围))。如果r不大于MaxRange,那么方法1400可返回到框1408且如本文所述而继续。否则,如果r大于MaxRange,那么方法1400可移到框1418,且编码器可设置经帧间预测的值等于预定默认值。在特定方面中,所述预定默认值等于值的范围内的中间值。举例来说,当数据帧的值的范围在零(0)与两百五十五(255)之间时,所述预定默认值可为一百二十八(128)。接着,方法1400可结束。
结合图14描述的方法1400可用于边缘和中点两者。在所述方法用以预测边缘值的情况下,RefPt可对应于由边缘图给出的位置。在方法1400用以预测中点值的情况下,RefPt可对应于由中点图给出的位置。
图16展示对水平和垂直中点进行编码的方法,其表示为1600。可对当前帧数据(CFD)1602和像素1604执行方法1600。CFD 1602可包含中点图和边缘图。在框1606处开始,可获得水平中点的位置。进一步来说,在框1608处,可获得垂直中点的位置。在框1610处,可获得相邻中点值。进一步来说,在框1612处,可执行线性边缘内/中点内预测。此后,可输出中点残数,且方法1600可结束。
现在参看图17,展示边缘内/中点内预测的方法,且概括表示为1700。可对边缘图1702和中点图1704执行图17中显示的方法1700。在框1706处开始,可通过边缘像素位置{EdgeLocs}以及中点像素位置{MidPtLocs}的联合来确定所发送像素集{SentPix}。换句话说,{SentPix}={EdgeLocs}+{MidPtLocs}。
在框1708处,可将帧图像划分为具有基于上次反复中的比例因子(SFLI)的尺寸的块。举例来说,如果SFLI等于二(2),那么可将所述帧图像划分为二乘二(2x2)像素的块。移到决策1710,编码器可确定图像像素块中的像素中是否有至少一者为SentPix中的一者。如果否,那么方法1700可进行到框1712,且可将预测值设置为与预定义默认值相等。在特定方面中,所述预定默认值等于一百二十八(128)。否则,如果图像像素块中的像素中的一者为SentPix中的一者,那么方法1700可移到框1714,且可将所述预测值设置为等于块中的像素的平均值。
在框1716处,确定未设置像素的残数为实际值减去框1712或框1714处确定的预测值。此后,可输出无损像素残数1718,且方法1700可结束。
在特定方面中,基于边缘的视频编解码器可对帧中的边缘和中点进行编码。随着反复的数目增多,所述基于边缘的视频编解码器可通过对越来越多的中点(样本)日益增多地进行编码来实现可按比例缩放译码。在最后一次反复后,原始帧的像素的子集可保持未被编码。这些未编码像素可在“无损编码遍”中被编码以便实现无损质量。图17中所述的方法1700提供基于经编码的边缘和中点的局部平均的预测性译码技术。方法1700可使用指示先前经编码像素(例如边缘像素、中点像素或其组合)的位置的位图。比例因子可用以确定水平或垂直方向上的每对边缘之间的最小距离以便确定其间的中点。
图18说明内插像素值的方法的第一方面,概括表示为1800。在框1802处开始,可通过解码器定位缺漏像素。在框1804处,解码器可确定多个最接近像素。进一步来说,在框1806处,解码器可确定用于多个最接近像素中的每一者的值(例如亮度值)。在框1808处,解码器可确定离所述多个最接近像素中的每一者的距离。在框1810处,解码器可将多个最接近像素中的每一者分类为边缘像素或非边缘像素。此后,在框1812处,解码器可基于多个最接近像素中每一者的值、离所述多个最接近像素中的每一者的距离以及对所述多个最接近像素中的每一者的分类来确定缺漏像素的值。接着,方法1800可结束。
参看图19,展示内插像素值的方法的第二方面,且概括表示为1900。图20是可能在对图19中所述方法的论述期间提到的像素的说明。
在框1902处开始,可通过解码器定位缺漏像素P。在框1904处,解码器可定位两个最接近的垂直像素:A和B。这两个最接近的垂直像素可包含沿垂直轴的第一像素以及沿垂直轴的第二像素。进一步来说,在框1906处,解码器可定位两个最接近的水平像素:C和D。这两个最接近的水平像素可包含沿水平轴的第一像素以及沿水平轴的第二像素。在框1908处,解码器可确定用于最接近像素中的每一者的值(例如色密度值)。所述值可表示为A、B、C和D。在框1910处,从P到每一最接近像素的距离可由所述解码器确定。所述距离可表示为a、b、c和d。如图20中所示,a为离像素A的距离、b为离像素B的距离、c为离像素C的距离且d为离像素D的距离。
移到决策1912,解码器可确定特定像素A、B、C或D是边缘还是中点。如果特定像素为边缘,那么方法1900可进行到框1914,且解码器可设置针对所述特定像素的掩模L等于零(0)。另一方面,如果特定像素为中点,那么方法1900可继续到框1916,且解码器可设置针对所述特定像素的掩模L等于一(1)。从框1914或框1916中开始,方法1900可继续到框1918。
在框1918处,解码器可确定垂直预测值(Vert_Pred)。所述垂直预测值可使用以下公式确定:
Vert_Pred=(LA*A*b+LB*B*a)/(LB*a+LA*b)
其中:
LA=像素A的掩模,
A=像素A的值,
b=离像素B的距离,
LB=像素B的掩模,
b=像素B的值,且
a=离像素A的距离。
移到块1920,解码器可确定水平预测值(Horz_Pred)。所述水平预测值可使用以下公式确定:
Horz_Pred=(LC*C*d+Ld*D*c)/(LD*c+LC*d)
其中:
LC=像素C的掩模,
C=像素C的值,
d=离像素D的距离,
LD=像素D的掩模,
D=像素D的值,且
d=离像素D的距离。
在框1922处,解码器可根据所述垂直预测值和所述水平预测值确定针对P的所内插值。可根据以下公式确定针对P的所述所内插值:
所内插值(P)=(Vert_Pred+Horz_Pred)/2
其中:
Vert_Pred=在框1918处确定的垂直预测值;且
Horz_Pred=在框1920确定的水平预测值。
在特定方面中,结合图19所述的方法1900可使用四个最接近像素(两个水平和两个垂直)的值、四个最接近像素的位置(距离)以及最接近可用像素的分类(边缘或中点)来预测(或内插)缺漏像素的值。如果最接近像素为边缘,那么所述像素无法用于内插。如果最接近像素为中点,那么所述像素可用于通过应用距离加权因子来内插缺漏像素的值。
结合图19所述的方法1900相对较简单,且由于方法1900仅使用线性运算符,因此其计算成本可能较小。然而,方法1900可扩展到较高阶等式,用于在损失额外计算成本的情况下获得较好的性能。进一步来说,由于仅仅中点而不是边缘用于内插,因此方法1900可确保可能与经内插像素值的真实值显著不同的边缘上的样本并不用作预测值。此外,经加权预测可帮助改变各种参考点的影响。经加权预测在具有从上到下或从左到右的平滑转变的区中可能非常有效。
将理解,本文中所述的方法未必必须以所述的次序执行。进一步来说,例如“此后”、“接着”、“接下来”等词语并不意在限制步骤的次序。这些词语只是用来引导读者浏览对方法的描述。
通过本文所述配置,本文所揭示的系统和方法提供内插算法,所述内插算法可用以使用内插从可用像素中恢复一个或一个以上缺漏像素。进一步来说,本文中的系统和方法提供选择性隅角细化。可识别含文本的区,且接着可检测文本内的隅角并将所述隅角添加到边缘图。另外,本文揭示的系统和方法提供帧间预测法和帧内预测法。本文的系统和方法还提供用于减小中点的密度并恢复界标点的方法。可将沿水平或垂直方向的两个边缘之间的中心处的像素编码为中点。然而,由于图像中边缘的性质,图像中的很多均匀区均可包含高密度的中点。可从所发射的位流中减少任何额外的中点,因为它们并不导致图像质量有显著的改进。
在一个或一个以上示范性方面中,可以硬件、软件、固件或其任何组合来实施所述的功能。如果以软件实施,那么可将功能作为一个或一个以上指令或代码存储在计算机可读媒体上或经由计算机可读媒体而传输。计算机可读媒体包含计算机存储媒体与通信媒体两者,所述通信媒体包含促进计算机程序从一处传送到另一处的任何媒体。存储媒体可为可由计算机存取的任何可用媒体。作为实例而非限制,所述计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以运载或存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。而且,严格地说,任何连接均被称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输软件,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波等无线技术包含在媒体的定义中。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。上述各项的组合也应包含在计算机可读媒体的范围内。
虽然已详细说明及描述了选定方面,但将理解,在不脱离所附权利要求书界定的本发明的精神及范围的情况下,可在本发明中进行各种替代及更改。

Claims (28)

1.一种边缘内/中点内预测的方法,所述方法包括:
确定多个所发送像素;
将图像划分为多个具有预定大小的像素块;以及
确定每一像素块内的任何像素是否在所述多个所发送像素内。
2.根据权利要求1所述的方法,其中所述多个所发送像素包括多个边缘像素和多个中点像素。
3.根据权利要求1所述的方法,其中将所述预定尺寸设置为等于上次反复中的比例因子。
4.根据权利要求1所述的方法,其进一步包括:
在所述像素块内的所述像素均不在所述多个所发送像素内时,设置预测值等于预定默认值。
5.根据权利要求4所述的方法,其进一步包括:
设置预测值等于所述像素块内的所有所发送像素值的均值。
6.根据权利要求5所述的方法,其进一步包括:
确定未发送像素的残数。
7.根据权利要求6所述的方法,其中未发送像素的所述残数包括实际值减去所述预测值。
8.一种装置,其包括:
用于确定多个所发送像素的装置;
用于将图像划分为多个具有预定大小的像素块的装置;以及
用于确定每一像素块内的任何像素是否在所述多个所发送像素内的装置。
9.根据权利要求8所述的装置,其中所述多个所发送像素包括多个边缘像素和多个中点像素。
10.根据权利要求8所述的装置,其中所述预定大小被设置为等于上次反复中的比例因子。
11.根据权利要求8所述的装置,其进一步包括:
用于在所述像素块内的所述像素均不在所述多个所发送像素内时设置预测值等于预定默认值的装置。
12.根据权利要求11所述的装置,其进一步包括:
用于设置预测值等于所述像素块内的所有所发送像素值的均值的装置。
13.根据权利要求12所述的装置,其进一步包括:
用于确定未发送像素的残数的装置。
14.根据权利要求13所述的装置,其中未发送像素的所述残数包括实际值减去所述预测值。
15.一种装置,其包括:
处理器,其中所述处理器可操作以:
确定多个所发送像素;
将图像划分为多个具有预定大小的像素块;以及
确定每一像素块内的任何像素是否在所述多个所发送像素内。
16.根据权利要求15所述的装置,其中所述多个所发送像素包括多个边缘像素和多个中点像素。
17.根据权利要求15所述的装置,其中所述预定大小被设置为等于上次反复中的比例因子。
18.根据权利要求15所述的装置,其中所述处理器进一步可操作以:
在所述像素块内的所述像素均不在所述多个所发送像素内时,设置预测值等于预定默认值。
19.根据权利要求18所述的装置,其中所述处理器进一步可操作以:
设置预测值等于所述像素块内的所有所发送像素值的均值。
20.根据权利要求19所述的装置,其中所述处理器进一步可操作以:
确定未发送像素的残数。
21.根据权利要求20所述的装置,其中未发送像素的所述残数包括实际值减去所述预测值。
22.一种计算机程序产品,其包括:
计算机可读媒体,其包括:
用于确定多个所发送像素的至少一个指令;
用于将图像划分为多个具有预定大小的像素块的至少一个指令;以及
用于确定每一像素块内的任何像素是否在所述多个所发送像素内的至少一个指令。
23.根据权利要求22所述的计算机程序产品,其中所述多个所发送像素包括多个边缘像素和多个中点像素。
24.根据权利要求22所述的计算机程序产品,其中所述预定大小被设置为等于上次反复中的比例因子。
25.根据权利要求22所述的计算机程序产品,其中所述计算机可读媒体进一步包括:
用于在所述像素块内的所述像素均不在所述多个所发送像素内时设置预测值等于预定默认值的至少一个指令。
26.根据权利要求25所述的计算机程序产品,其中所述计算机可读媒体进一步包括:
用于设置预测值等于所述像素块内的所有所发送像素值的均值的至少一个指令。
27.根据权利要求26所述的计算机程序产品,其中所述计算机可读媒体进一步包括:
用于确定未发送像素的残数的至少一个指令。
28.根据权利要求27所述的计算机程序产品,其中未发送像素的所述残数包括实际值减去所述预测值。
CN201410772702.1A 2009-07-29 2010-07-29 用于像素内插的系统及方法 Pending CN104469383A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/511,349 US9129409B2 (en) 2009-07-29 2009-07-29 System and method of compressing video content
US12/511,349 2009-07-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201080038969.8A Division CN102484710B (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法

Publications (1)

Publication Number Publication Date
CN104469383A true CN104469383A (zh) 2015-03-25

Family

ID=42988398

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201410772702.1A Pending CN104469383A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201080038969.8A Expired - Fee Related CN102484710B (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201410769064.8A Pending CN104486531A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201410772689.XA Pending CN104539958A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201410771146.6A Pending CN104469382A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN201080038969.8A Expired - Fee Related CN102484710B (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201410769064.8A Pending CN104486531A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201410772689.XA Pending CN104539958A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法
CN201410771146.6A Pending CN104469382A (zh) 2009-07-29 2010-07-29 用于像素内插的系统及方法

Country Status (6)

Country Link
US (1) US9129409B2 (zh)
EP (5) EP2667606A1 (zh)
JP (3) JP5539515B2 (zh)
KR (6) KR101452735B1 (zh)
CN (5) CN104469383A (zh)
WO (1) WO2011014633A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110971858A (zh) * 2018-10-01 2020-04-07 联咏科技股份有限公司 帧率提升转换装置及其操作方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156967B (zh) * 2011-04-11 2012-10-17 上海交通大学 基于多尺度的局部的图像内插方法
US8681866B1 (en) 2011-04-28 2014-03-25 Google Inc. Method and apparatus for encoding video by downsampling frame resolution
US8780976B1 (en) * 2011-04-28 2014-07-15 Google Inc. Method and apparatus for encoding video using granular downsampling of frame resolution
US10536726B2 (en) * 2012-02-24 2020-01-14 Apple Inc. Pixel patch collection for prediction in video coding system
US9524536B2 (en) * 2014-07-25 2016-12-20 Intel Corporation Compression techniques for dynamically-generated graphics resources
JPWO2017061189A1 (ja) * 2015-10-05 2018-09-13 シャープ株式会社 画像復号装置または画像符号化装置のための画像予測装置
WO2017153499A1 (en) * 2016-03-08 2017-09-14 Thomson Licensing Methods for performing an intra prediction encoding and decoding of at least one picture, and corresponding electronic devices
KR102254162B1 (ko) * 2016-05-12 2021-05-20 엘지전자 주식회사 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
CN107786874A (zh) * 2016-08-24 2018-03-09 浙江大学 双向的帧内方向性预测方法和装置
US10791340B2 (en) 2016-11-15 2020-09-29 Sony Corporation Method and system to refine coding of P-phase data
DE102018122295A1 (de) * 2018-09-12 2020-03-12 Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg Verfahren zur Kompression von Bilddaten
US10848772B2 (en) * 2018-09-28 2020-11-24 Ati Technologies Ulc Histogram-based edge/text detection
US11272185B2 (en) 2018-10-31 2022-03-08 Ati Technologies Ulc Hierarchical measurement of spatial activity for text/edge detection
CN111935484B (zh) * 2020-09-28 2021-01-19 广州佰锐网络科技有限公司 一种视频帧压缩编码方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418714A (en) * 1993-04-08 1995-05-23 Eyesys Laboratories, Inc. Method and apparatus for variable block size interpolative coding of images
CN1421098A (zh) * 1999-08-27 2003-05-28 三叉微系统公司 运动及边缘自适应去隔行扫描
CN1503959A (zh) * 2001-03-13 2004-06-09 ��ǿ��˹�ɷ����޹�˾ 视觉装置、联动式计数器及图象检测器

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4558370A (en) * 1983-11-21 1985-12-10 International Business Machines Corporation Image processing method for graphics images
JP2507204B2 (ja) * 1991-08-30 1996-06-12 松下電器産業株式会社 映像信号符号化装置
US5400076A (en) 1991-11-30 1995-03-21 Sony Corporation Compressed motion picture signal expander with error concealment
JP3159327B2 (ja) 1991-11-30 2001-04-23 ソニー株式会社 動画像データ復号化装置
JP2621747B2 (ja) * 1992-10-06 1997-06-18 富士ゼロックス株式会社 画像処理装置
US5446804A (en) 1994-04-14 1995-08-29 Hewlett-Packard Company Magnifying digital image using edge mapping
KR0174455B1 (ko) 1995-02-28 1999-03-20 배순훈 화소단위 움직임예측을 이용하는 영상신호 부호화 방법 및 장치
KR100242636B1 (ko) 1996-03-23 2000-02-01 윤종용 블록화효과 및 링잉노이즈 감소를 위한 신호적응후처리시스템
JP3477603B2 (ja) 1997-04-07 2003-12-10 株式会社日立製作所 画像処理方法、画像処理装置および画像処理プログラムを記録した記録媒体
JPH1169144A (ja) * 1997-08-12 1999-03-09 Sony Corp 画像信号の変換装置および変換方法
JP3868654B2 (ja) 1998-03-27 2007-01-17 株式会社リコー 画像処理装置
JP2001008037A (ja) 1999-06-23 2001-01-12 Nec Corp 画素補間方法および回路
EP1117072A1 (en) 2000-01-17 2001-07-18 Koninklijke Philips Electronics N.V. Text improvement
US6842483B1 (en) 2000-09-11 2005-01-11 The Hong Kong University Of Science And Technology Device, method and digital video encoder for block-matching motion estimation
US7764839B2 (en) * 2003-08-14 2010-07-27 Fujifilm Corporation Edge detecting apparatus and method, and image size enlarging and reducing apparatus and method
US7433535B2 (en) 2003-09-30 2008-10-07 Hewlett-Packard Development Company, L.P. Enhancing text-like edges in digital images
JP4414195B2 (ja) 2003-11-06 2010-02-10 富士フイルム株式会社 画像補間方法および装置並びにプログラム
US7391920B2 (en) * 2003-11-04 2008-06-24 Fujifilm Corporation Image processing method, apparatus, and program
KR100530224B1 (ko) 2004-04-20 2005-11-22 삼성전자주식회사 이미지 변환 장치 및 그 방법
KR100647284B1 (ko) 2004-05-21 2006-11-23 삼성전자주식회사 영상의 문자 추출 장치 및 방법
EP1631068A3 (en) * 2004-08-26 2008-09-03 Samsung Electronics Co., Ltd. Apparatus and method for converting interlaced image into progressive image
EP1856912A2 (en) * 2005-02-28 2007-11-21 Nxp B.V. New compression format and apparatus using the new compression format for temporarily storing image data in a frame memory
CN1892696B (zh) * 2005-07-08 2010-06-16 深圳迈瑞生物医疗电子股份有限公司 超声图像边缘锐化与斑点抑制方法
KR100754735B1 (ko) * 2006-02-08 2007-09-03 삼성전자주식회사 에지 신호 성분을 이용한 효율적인 영상 확대 방법 및 이를위한 장치
RU2310911C1 (ru) 2006-06-14 2007-11-20 Самсунг Электроникс Ко., Лтд. Способ интерполяции изображений
CN100511269C (zh) * 2006-06-26 2009-07-08 北京航空航天大学 一种基于角点引导的图像快速边缘匹配方法
CN101123682B (zh) * 2006-08-11 2011-06-22 松下电器产业株式会社 可减少图像振铃噪声的方法、装置及集成电路
JP3955910B2 (ja) * 2006-12-04 2007-08-08 国立大学法人九州工業大学 画像信号処理方法
KR101312260B1 (ko) * 2007-01-19 2013-09-25 삼성전자주식회사 에지 영역을 효과적으로 압축하고 복원하는 방법 및 장치
US8000535B2 (en) * 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
FR2921504B1 (fr) 2007-09-21 2010-02-12 Canon Kk Procede et dispositif d'interpolation spatiale
EP2046047A1 (en) 2007-10-04 2009-04-08 Thomson Licensing Method and device for performing motion estimation
CN101184233B (zh) * 2007-12-12 2010-06-02 中山大学 一种基于cfrfs数字视频压缩编码的方法
CN101267556B (zh) * 2008-03-21 2011-06-22 海信集团有限公司 快速运动估计方法及视频编解码方法
CN101261234B (zh) * 2008-03-26 2010-06-09 广州中国科学院工业技术研究院 表面缺陷检测装置
CN100574391C (zh) 2008-07-17 2009-12-23 友达光电股份有限公司 影像处理装置及影像数据内插方法
CN101431606A (zh) * 2008-12-01 2009-05-13 上海广电(集团)有限公司中央研究院 一种基于边缘检测的自适应降噪处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418714A (en) * 1993-04-08 1995-05-23 Eyesys Laboratories, Inc. Method and apparatus for variable block size interpolative coding of images
CN1421098A (zh) * 1999-08-27 2003-05-28 三叉微系统公司 运动及边缘自适应去隔行扫描
CN1503959A (zh) * 2001-03-13 2004-06-09 ��ǿ��˹�ɷ����޹�˾ 视觉装置、联动式计数器及图象检测器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
K.-L.HUNG: "New irregular sampling coding method for transmitting images progressively", 《IEE PROCEEDINGS-VISION,IMAGE AND SIGNAL PROCESSING》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110971858A (zh) * 2018-10-01 2020-04-07 联咏科技股份有限公司 帧率提升转换装置及其操作方法
CN110971858B (zh) * 2018-10-01 2021-06-01 联咏科技股份有限公司 帧率提升转换装置及其操作方法

Also Published As

Publication number Publication date
EP2667605A2 (en) 2013-11-27
KR20130119511A (ko) 2013-10-31
WO2011014633A3 (en) 2011-05-05
JP2016006979A (ja) 2016-01-14
KR20130119510A (ko) 2013-10-31
CN104469382A (zh) 2015-03-25
EP2667608A3 (en) 2017-06-21
EP2667605A3 (en) 2017-06-14
KR101452735B1 (ko) 2014-10-23
CN104539958A (zh) 2015-04-22
JP2013501411A (ja) 2013-01-10
EP2667606A1 (en) 2013-11-27
KR101546864B1 (ko) 2015-08-24
KR20130119509A (ko) 2013-10-31
KR20150116903A (ko) 2015-10-16
EP2460356A2 (en) 2012-06-06
CN104486531A (zh) 2015-04-01
CN102484710B (zh) 2016-10-26
KR20120034821A (ko) 2012-04-12
JP5976702B2 (ja) 2016-08-24
US20110026582A1 (en) 2011-02-03
KR101527554B1 (ko) 2015-06-10
KR20130119512A (ko) 2013-10-31
EP2667608A2 (en) 2013-11-27
EP2667607A3 (en) 2014-09-10
KR101517802B1 (ko) 2015-05-06
JP2014123962A (ja) 2014-07-03
WO2011014633A2 (en) 2011-02-03
US9129409B2 (en) 2015-09-08
EP2667607A2 (en) 2013-11-27
JP5539515B2 (ja) 2014-07-02
CN102484710A (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN104469383A (zh) 用于像素内插的系统及方法
CN111010568B (zh) 插值滤波器的训练方法、装置及视频图像编解码方法、编解码器
US7362804B2 (en) Graphical symbols for H.264 bitstream syntax elements
CN100568973C (zh) 数字图像的过滤方法和过滤设备
US20110026591A1 (en) System and method of compressing video content
US20100128798A1 (en) Video processor using optimized macroblock sorting for slicemap representations
MX2012011451A (es) Dispositivo y metodo de procesamiento de imagenes.
US20150117540A1 (en) Coding apparatus, decoding apparatus, coding data, coding method, decoding method, and program
CN114339260A (zh) 图像处理方法及装置
US20220353497A1 (en) Video picture decoding and encoding method and apparatus
US20220046234A1 (en) Picture prediction method and apparatus, and computer-readable storage medium
JP2005033763A (ja) 送信装置、画像処理システム、画像処理方法、プログラム、及び記録媒体
WO2011125809A1 (ja) 画像処理装置および方法
US20230319287A1 (en) Systems and methods for video encoding
US11622118B2 (en) Determination of coding modes for video content using order of potential coding modes and block classification
RU2810126C2 (ru) Способ и устройство прогнозирования изображений и считываемый компьютером носитель данных

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150325