CN107509079A - 文字块编码方法及装置 - Google Patents

文字块编码方法及装置 Download PDF

Info

Publication number
CN107509079A
CN107509079A CN201710701332.6A CN201710701332A CN107509079A CN 107509079 A CN107509079 A CN 107509079A CN 201710701332 A CN201710701332 A CN 201710701332A CN 107509079 A CN107509079 A CN 107509079A
Authority
CN
China
Prior art keywords
component value
subclass
value
character block
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710701332.6A
Other languages
English (en)
Other versions
CN107509079B (zh
Inventor
杨文晋
苏睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Wanxiang Electronics Technology Co Ltd
Original Assignee
Xian Wanxiang Electronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Wanxiang Electronics Technology Co Ltd filed Critical Xian Wanxiang Electronics Technology Co Ltd
Priority to CN201710701332.6A priority Critical patent/CN107509079B/zh
Publication of CN107509079A publication Critical patent/CN107509079A/zh
Application granted granted Critical
Publication of CN107509079B publication Critical patent/CN107509079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Color Image Communication Systems (AREA)

Abstract

本公开提供一种文字块编码方法及装置,涉及文字处理技术领域,能够解决文字块编码过程中,文字块数量多、编码效率低的问题。具体技术方案为:从屏幕视频的一帧图像包含的宏块中分离出文字块,根据文字块的基本色个数和占比对文字块进行分类,进而利用颜色相关性,将颜色相似的文字块划分为一个子类,然后对不同的子类的文字块进行编码和记录,对同一子类统一进行编码。本发明用于屏幕视频图像中文字块的处理。

Description

文字块编码方法及装置
技术领域
本公开涉及文字处理技术领域,尤其涉及一种文字块编码方法及装置。
背景技术
电脑屏幕画面采集的视频序列与摄像机等设备采集的视频序列有着较大的区别。在电脑屏幕画面中,较多场景会有文字画面,例如:浏览网页,播放幻灯片等会出现大量文字。编码过程中,通常将一帧图像划分为固定大小的宏块,将宏块划分为图片块和文字块,对图片块采用联合图像专家小组(J oint Photographic Experts Group,JPEG)进行压缩,对文字块则利用其能量集中的特点进行压缩编码。
文字块最主要的特征是主要的能量集中在较少的几种像素中,例如屏幕显示为一篇白底黑字的文章,可以认为主要能量集中在白色像素和黑色像素中。由此定义能量集中的像素域为基本色,其他的定义为逃逸色。基本色根据文字块的频率直方图确定,确定基本色以后得到基本色码表。根据基本色和逃逸色,按照相应序号对文字块中像素点进行编码(例如确定四个基本色,序号为0、1、2、3,所有逃逸色序号为4),在编码过程中引入预测。即每个像素点的YUV三个分量跟左侧的像素点YUV三个分量是否相等,如果相等用符号L表示;每个像素点跟上面的像素点YUV三个分量是否相等,如果相等用符号U表示;如果不相等用符号O表示。由此得到预测索引码表。对于符号为O的像素点,由于无法根据邻域得到本身的值,故需要编写O数据对应码表。前面步骤中,对于逃逸色统一编号为4,故需要编写逃逸色对应码表。最后将前面提到的基本色码表、预测索引码表、O数据码表、逃逸色码表编码后进行传输。
上述的文字块编码方式中,文字块的大小固定,文字块数量多,编码效率低。
发明内容
本公开实施例提供一种文字块方法及装置,能够解决文字块编码过程中,文字块数量多、编码效率低的问题。所述技术方案如下:
根据本公开实施例的第一方面,提供一种文字块编码方法,该方法包括:将屏幕视频中的一帧图像划分成M×N的宏块,将所述M×N的宏块分成图片块和文字块两类,M≥1,N≥1,且M和N均为整数;
将基本色个数相同、且所述基本色占比超过第一阈值的文字块划分为一类;
对于每一类文字块包含的多个文字块,将对应基本色所属的颜色值区间相同的文字块划分为一个子类;
对每一子类的文字块统一编码。
本公开实施例提供的文字块编码方法,充分利用了屏幕画面文字块间的颜色相关性,将颜色相似的文字块划分为一个子类,并统一编码,使得文字块的划分不再局限于固定大小,且不局限于空间上的位置关系,从而能够自适应的调整文字块的大小,大幅减少文字块数量,提高编码效率,能够适应不同终端分辨率的要求。另外,编码过程中,通过对颜色相似的文字块统一进行编码,能够更有效地去除文字块间的颜色冗余信息,进一步达到提高编码效率的目的。
在一个实施例中所述对每一子类的文字块统一编码之前,还包括:
对于每一子类文字块,确定该子类的基本色处于YUV色彩空间中的目标分量值;
根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果。
通过上述方法,实现对每个子类中的文字块的量化。
在一个实施例中所述根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果,包括:
对于该子类中的每个文字块,确定该文字块的原始分量值;
确定所述原始分量值与所述目标分量值的差值的绝对值是否小于或等于第二阈值;
若所述绝对值小于或等于所述第二阈值,则将所述原始分量值量化为所述目标分量值;
若所述绝对值大于所述第二阈值,则将所述原始分量值量化为逃逸色分量值。
通过上述方法,对于每个文字块,实现根据该文字块的原始分量值与目标分量值的差值,对该文字块的量化。
在一个实施例中,所述根据所述目标分量值,量化该子类中每个文字块的分量值,以得到量化结果,包括:
对于该子类中的每个文字块,确定该文字块的原始分量值;
确定所述目标分量值所属的颜色值区间;
确定所述原始分量值是否落于所述目标分量值的颜色值区间;
若所述原始分量值落于所述目标分量值的颜色值区间,则将所述原始分量值量化为所述目标分量值;
若所述原始分量值不落于所述目标分量值的颜色值区间,则将所述原始分量值量化为逃逸色分量值。
通过上述方法,实现对每个子类中的文字块的量化。
在一个实施例中,所述根据所述目标分量值,量化该子类中每个文字块的原始分量值之后,还包括:
对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值的索引值;
根据所述量化结果以及所述目标分量值的索引值,确定该子类的基本色码表、逃逸色码表以及预测索引码表。
通过上述方法,实现确定出每个子类的基本色码表、逃逸色码表以及预测索引码表的目的。
在一个实施例中,所述对每一子类的文字块统一编码,包括:
对于每一子类,确定该子类中每个文字块的位置信息;
根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
通过上述方法,实现对每个子类统一编码的目的。
在一个实施例中,所述目标分量值包括Y目标分量值、U目标分量值和V目标分量值,相应的,所述原始分量值包括Y原始分量值、U原始分量值和V原始分量值。
根据本公开的第二个方面,提供一种文字块的编码装置,包括:
第一划分模块,用于将屏幕视频中的一帧图像划分成M×N的宏块,将所述M×N的宏块分成图片块和文字块两类,M≥1,N≥1,且M和N均为整数;
第二划分模块,用于将基本色个数相同、且所述基本色占比超过第一阈值的文字块划分为一类;
第三划分模块,用于对于每一类文字块包含的多个文字块,将对应基本色所属的颜色值区间相同的文字块划分为一个子类;
编码模块,用于每一子类的文字块统一编码。
在一个实施例中,所述装置还包括:
处理模块,用于在所述编码模块对每一子类的文字块统一编码之前,对于每一子类文字块,确定该子类的基本色处于YUV色彩空间中的目标分量值;根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果。
在一个实施例中,所述处理模块,具体用于对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述原始分量值与所述目标分量值的差值的绝对值是否小于或等于第二阈值;若所述绝对值小于或等于所述第二阈值,则将所述原始分量值量化为所述目标分量值;若所述绝对值大于所述第二阈值,则将所述原始分量值量化为逃逸色分量值。
在一个实施例中,所述处理模块,具体用于对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述目标分量值所属的颜色值区间;确定所述原始分量值是否落于所述目标分量值的颜色值区间;若所述原始分量值落于所述目标分量值的颜色值区间,则将所述原始分量值量化为所述目标分量值;若所述原始分量值不落于所述目标分量值的颜色值区间,则将所述原始分量值量化为逃逸色分量值。
在一个实施例中,所述处理模块,在根据所述目标分量值,量化该子类中每个文字块的原始分量值之后,还用于对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值的索引值;根据所述量化结果以及所述目标分量值的索引值,确定该子类的基本色码表、逃逸色码表以及预测索引码表。
在一个实施例中,所述编码模块,具体用于对于每一子类,确定该子类中每个文字块的位置信息;根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
在一个实施例中,所述目标分量值包括Y目标分量值、U目标分量值和V目标分量值,相应的,所述原始分量值包括Y原始分量值、U原始分量值和V原始分量值。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本公开实施例提供的一种文字块编码方法流程图;
图2为本公开实施例提供的另一种文字块编码方法流程图;
图3为本公开实施例提供的一种文字块编码方法中对文字块分类的过程示意图;
图4为本公开实施例提供的一种文字块编码方法中基于基本色区间划分子类的示意图;
图5为本公开实施例提供的一种文字块的编码装置的一个示意图;
图6为本公开实施例提供的一种文字块的编码装置的另一个示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1为本公开实施例提供的一种文字块编码方法流程图,如图1所示,该文字块编码方法包括以下步骤:
101、将屏幕视频中的一帧图像划分成M×N的宏块,将所述M×N的宏块分成图片块和文字块两类,M≥1,N≥1,且M和N均为整数。
本公开实施例中,屏幕视频例如为视频会议、远程桌面等,该类屏幕视频的画面以文字块为主,文字块颜色单一。也就是说,本公开适合颜色个数较少的图像,而对于颜色数量较多的图像,采用JPEG等现有的方式进行压缩编码。具体实现时,可预先获取图像的颜色频率直方图,若该颜色频率直方图曲线平滑,则说明该图像包含的颜色数量较多,不适合本公开提供的方法;否则,若该颜色频率直方图曲线波动较大,则说明该图像包含的颜色数量较少,适合本公开提供的方法。
本步骤中,首先,获取屏幕视频中的一帧图像;然后,将其分成M×N(如16×16)的宏块,以屏幕视频中的一帧图像为1920×1080的图像、每个宏块的尺寸为16×16为例,则将该图像划分成8100个宏块;接着,利用文字和图像的不同特性,如宏块中基本色像素占比和高梯度像素个数等,使用分类器将每个宏块分成文字块或图片块。例如,若一个宏块包含的高梯度像素个数高、且该宏块包含的基本色像素的占比较高,说明该宏块包含的颜色较少,差异较大,颜色较为单一,则将其划分为文字块;再如,若一个宏块包含的高梯度像素个数低、且该宏块包含的基本色像素的占比较高,则说明该宏块包含的颜色较多、颜色变化小,则将其划分为图片块;又如,若一个宏块包含的高梯度像素个数低、且该宏块包含的基本色像素的占比较低,说明该宏块包含的的颜色较多、颜色变化小,则将其划分为图片块;又如,若一个宏块包含的高梯度像素个数高、且该宏块包含的基本色像素的占比较低,说明该宏块包含的的颜色较少、颜色变化小,则将其划分为图片块。
102、将基本色个数相同、且所述基本色占比超过第一阈值的文字块划分为一类。
本步骤中,基于基本色数量和基本色占比对文字块进行分类,分类过程中,先确定文字块的基本色,进而确定该文字块中,基本色像素的个数占该文字块所有像素的比例,即为基本色占比。具体的,统计每个文字块的颜色频率直方图,颜色频率直方图指示该文字块包含颜色以及各种颜色出现的概率,将基本色个数相同、且基本色占比超过第一阈值的文字块划分为同一类文字块,不同类之间没有重叠的文字块。其中,第一阈值可以根据需求设置,例如为80%。
以第一阈值为80%为例,一帧图像被划分为16×16个宏块,每个宏块的尺寸为16×16,其中文字块为128个。该128个文字块中,基本色为2个、且基本色占比超过80%的文字块有16个,则将该16个文字块划分为一类,其中,2个基本色例如为黑色和白色,或者白色和红色等;剩余的112个文字块中,基本色个数为3个、且基本色占比超过80%的文字块有32个,则将该32个文字块划分为一类,其中,3个基本色例如为黑色、白色和红色,或者白色、绿色和黄色;进而剩余的80个文字块中,基本色个数为4个、且基本色占比超过80%的文字块有20个,则将该20个文字块划分为一类;……;直到对所有的文字块分类完毕。
103、对于每一类文字块包含的多个文字块,将对应基本色所属的颜色值区间相同的文字块划分为一个子类。
本步骤中,基于基本色区间对同一个类别的文字块继续分类,从而将同一类的文字块划分为不同的子类。子类划分过程中,将256(0~255)个颜色值按一定间隔(如16)划分为不同的区间,确定每一个文字宏块的基本色所属的区间编号,将基本色所在区间编号一样的文字块划分为同一个子类,从而利用颜色相关性,将颜色相似的文字块划分为一个子类。
104、对每一子类的文字块统一编码。
子类划分完毕后,对不同的子类分别编码基本色、基本色索引值、逃逸色、逃逸色索引值,然后对同一个子类的文字块统一编码,即对颜色相似的文字块统一编码。具体实现时,对于一个子类,确定该子类中每个文字块的位置信息,根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
本公开提供的文字块编码方法,从屏幕视频的一帧图像包含的宏块中分离出文字块,根据文字块的基本色个数和占比对文字块进行分类,进而利用颜色相关性,将颜色相似的文字块划分为一个子类,然后对不同的子类进行编码和记录,对同一子类统一进行编码。编码过程中,充分利用了屏幕画面文字块间的颜色相关性,将颜色相似的文字块划分为一个子类,并统一编码,使得文字块的划分不再局限于固定大小,且不局限于空间上的位置关系,从而能够自适应的调整文字块的大小,大幅减少文字块数量,提高编码效率,能够适应不同终端分辨率的要求。另外,编码过程中,通过对颜色相似的文字块统一进行编码,能够更有效地去除文字块间的颜色冗余信息,进一步达到提高编码效率的目的。
下面,用一个具体的例子对上述的文字块编码方法进行详细说明。具体的,可参见图2、图3与图4,图2为本公开实施例提供的另一种文字块编码方法流程图,图3为本公开实施例提供的一种文字块编码方法中对文字块分类的过程示意图,图4为本公开实施例提供的一种文字块编码方法中基于基本色区间划分子类的示意图。
如图2所示,该文字块编码方法包括以下步骤:
201、根据宏块的高梯度像素和基本像素占比,将一帧图像包含的宏块划分为图片块或文字块。
202、基于基本色特征自适应划分文字块。
具体的,请同时参见图3,以第一阈值为80%为例,文字块划分过程中,将基本色个数为2种、且该2种基本色占比的和超过80%的文字块记为A类;将基本色个数为3种、且该3种基本色占比的和超过80%的文字块记为B类,……,以此类推。
类别划分后,针对每一类文字块进一步划分子类。划分过程中,将256个颜色值按一定间隔(如16)划分区间,依次为区间0~15、16~31、32~47、48~63、……、224~239、240~255,对应区间标分别记为1,2…16。对于同一类文字块,确定该类文字块中的每一个文字块的基本色的区间编号,将对应基本色所属的颜色值区间相同的文字块划分为一个子类,记为A1子类、A2子类、……、B1子类、B2子类、……、C1子类、C2子类等,以此类推,直到完成对每类中所有文字块的子类划分。
请参照图4,以对A类进行子类划分为例,假设A类包括18个文字块,每个文字块的基本色为a、b,a落于1区间、b落于2区间的文字块有4个,则将该4个文字块划分为一个子类,记为A1子类;a落于10区间、b落于11区间的文字块有4个,则将该4个文字块划分为一个子类,记为A2子类;a落于3区间、b落于4区间的文字块有10个,则将该10个文字块划分为一个子类,记为A3子类。
203、基于基本色量化参数与逃逸色量化参数对文字块进行量化,得到量化结果。
具体的,对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值;根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果。其中,目标分量值包括基本色Y目标分值量、基本色U目标分量值以及基本色V目标分量值;相应的,所述原始分量值包括Y原始分量值、U原始分量值和V原始分量值。确定目标分量值的时候,优选的,可以将出现频率最高的分量值作为目标分量值,另外,也可以自行设定目标分量值,本公开并不限制。
本步骤中,对于一个具体的文字块,量化过程包括利用基本色Y目标分量值对该文字块的基本色Y分量值进行量化、利用基本色U目标分量值对该文字块的基本色U分量值进行量化、利用基本色V目标分量值对该文字块的基本色V分量值进行量化,以及逃逸色Y目标分量值对该文字块的逃逸色Y分量值进行量化、利用逃逸色U目标分量值对该文字块的逃逸色U分量值进行量化、利用逃逸色V目标分量值对该文字块的逃逸色V分量值进行量化。
根据上述可知:本公开实施例中,一个具体的子类对应的基本色落入不同的颜色值区间,每一个颜色值区间包含很多相近的颜色,为了使得一个子类的文字块的颜色统一,需要对该子类包含各个文字块的基本色进行量化,将其量化为一种颜色。例如,一个子类包含3个文字块,该3个文字块的Y原始分量值为2个,每个文字块的Y原始分量值分别落入1区间(0~15)和16区间(240~255),其中一个Y原始分量值分别位于1区间的3、7、14,另一个Y原始分量值分别位于16区间的242、250、255,而1区间和16区间的基本色Y目标分量值分别为8和248,则通过量化,分别将3个文字块的Y原始分量值量化为基本色Y目标分量值,若无法量化为基本色Y目标分量值,则量化为逃逸色Y分量值。其中,基本色Y目标分量值分别为8和248为自行设定的,分别为1区间的中间值和16区间的中间值。
在一种可行的实现方式中,对于每一子类文字块,确定该子类的目标分量值后,对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述原始分量值与所述目标分量值的差值的绝对值是否小于或等于第二阈值;若所述绝对值小于或等于所述第二阈值,则将所述原始分量值量化为所述目标分量值;若所述绝对值大于所述第二阈值,则将所述原始分量值量化为逃逸色分量值,逃逸色分量值可统一设定。以对Y原始分量值进行量化、第二阈值为4为例,一个子类包含5个文字块,该子类的文字块的基本色Y原始分量值分别落入1区间和2区间,1区间的颜色值范围是1~15;2区间的颜色值范围是16~31。5个文字块中,落入1区间的Y原始分量值分别为10、8、10、10、14,其中,10出现的频率最高,将10作为基本色Y目标分量值,量化过程中,将该5个文字块的Y原始分量值均量化为10;落入2区间的Y原始分量值分量为22、19、22、22、28,其中,22出现的频率最高,将22作为基本色Y目标分量值,量化过程中,将前4个的Y原始分量值量化为22,最后一个文字的的Y原始分量值量化为逃逸色分量值。
在另一种可行的实现方式中,对于每一子类文字块,确定该子类的目标分量值后,对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述目标分量值所述的颜色值区间;确定所述原始分量值是否落于所述目标分量值的颜色值区间;若所述原始分量值落于所述目标分量值的颜色值区间,则将所述原始分量值量化为所述目标分量值;若所述原始分量值不落于所述目标分量值的颜色值区间,则将所述原始分量值量化为逃逸色分量值。
在又一种可行的实现方式中,对于每一子文字块,确定该子类的目标分量值后,对于该子类中的每个文字块,确定该文字块的原始分量值,然后将该文字块的原始分量值量化为目标分量值。量化过程中,不区分逃逸色,而是直接进行量化编码。
下面,令基本色Y分量值的量化步长为σY1,基本色U分量值、基本色V分量值的量化步长为σUV1;令逃逸色Y分量值的量化步长为σY2,逃逸色U分量值、逃逸色V分量值的量化步长为σUV2,对量化过程进行详细说明。
以对基本色Y分量值进行量化为例,量化过程中,对于一个具体的子类,首先,统计该子类所有文字块的Y分量值颜色的统计频率直方图;其次,以2σ1为步长,在统计频率直方图中找到频率最大、且该子类对应的基本色个数个区间,例如,A1子类两个区间,B1子类3个区间,C1子类4个区间,……;然后,记录能量最大区间对应的数据值,记为基本色Y目标分量值(用
Y_base_color表示);最后,利用基本色Y目标分量值对该子类中的文字块的Y分量值进行量化。
例如,对于该子类中的一个文字块,确定该文字块的原始Y数据,即该文字块的基本色Y原始分量值,若该基本色Y原始分量值与基本色Y目标分量值的差值的绝对值小于或等于第二阈值,则将该文字块的基本色Y原始分量值量化为基本色Y目标分量值。其中,第二阈值例如为量化步长σY1
再如,对于该子类中的一个文字块,确定该文字块的原始Y数据,即该文字块的基本色Y原始分量值,若该基本色Y原始分量值所属的颜色值区间,与基本色Y目标分量值所属的颜色值区间相同,则将该文字块的基本色Y原始分量值量化为基本色Y目标分量值。
对于无法将基本色Y原始分量值量化为基本色Y目标分量值的文字块,将其基本色Y原始分量值称之为逃逸色Y分量值,并将其量化为
基本色U分量值、基本色V分量值的量化方法与基本色Y分量值的量化方法相同,具体可参见上述基本色Y分量值的量化过程,此处不再赘述;逃逸色U分量值、逃逸色V分量值的量化方法与逃逸色Y分量值的量化方法相同,具体可参见上述逃逸色Y分量值的量化过程,此处不再赘述。
204、对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值的索引值。
205、确定该子类的基本色码表、逃逸色码表以及预测索引码表。
本步骤中,编码基本色和逃逸色,按照相应序号对文字块中像素点进行编码,在编码过程中引入预测,从而得到预测索引码表。也就是说,对于每一子类文字块,确定该子类的目标分量值的索引值;根据所述量化结果以及所述目标分量值的索引值,确定该子类的基本色码表、逃逸色码表以及预测索引码表。
上述步骤204与205中,以对文字块的基本色Y分量值为例,将文字块量化后的基本色Y分量值的值用对应索引表示,例如,对于A1子类的文字块,其基本色Y目标分量值共计2个,对应的索引为0~1,逃逸色索引为2,若A1子类的文字块的原始Y数据被量化为基本色Y目标分量值,则该文字块用基本色Y目标分量值对应的索引,即0~1表示;若A1子类的文字块的原始Y数据被量化为逃逸色,则该文字块用逃逸色对应的索引,即2表示;再如,对于B1子类的文字块,其基本色Y目标分量值共计3个,对应的索引为0~2,逃逸色索引为3,若B1子类的文字块的原始Y数据被量化为基本色Y目标分量值,则该文字块用基本色Y目标分量值对应的索引,即0~2表示;若B1子类的文字块的原始Y数据被量化为逃逸色,则该文字块用逃逸色对应的索引,即3表示。
206、对于每一子类,确定该子类中每个文字块的位置信息。
207、根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
步骤206与207中,对于一个子类中的每个文字块,确定该文字块的位置信息,如文字块在图像中的坐标等。编码过程中,对于一个子类文字块,进行统一编码,如果相邻位置的像素YUV分量相同,则只需要对一个像素编码,对另一个做标记即可。例如,如果一个像素与左边相邻的像素YUV分量相同,标记为L,如果一个像素与上边相邻的像素YUV分量相同,标记为U,不需要对所有像素进行编码,只需要编码一部分像素,实现了统一编码。
图5为本公开实施例提供的一种文字块的编码装置的一个示意图,如图5所示,该文字块的编码装置10包括:
第一划分模块101,用于将屏幕视频中的一帧图像划分成M×N的宏块,将所述M×N的宏块分成图片块和文字块两类,M≥1,N≥1,且M和N均为整数;
第二划分模块102,用于将基本色个数相同、且所述基本色占比超过第一阈值的文字块划分为一类;
第三划分模块103,用于对于每一类文字块包含的多个文字块,将对应基本色所属的颜色值区间相同的文字块划分为一个子类;
编码模块104,用于每一子类的文字块统一编码。
本公开实施例提供的文字块的编码装置,从屏幕视频的一帧图像包含的宏块中分离出文字块,根据文字块的基本色个数和占比对文字块进行分类,进而利用颜色相关性,将颜色相似的文字块划分为一个子类,然后对不同的子类进行编码和记录,对同一子类统一进行编码。编码过程中,充分利用了屏幕画面文字块间的颜色相关性,将颜色相似的文字块划分为一个子类,并统一编码,使得文字块的划分不再局限于固定大小,且不局限于空间上的位置关系,从而能够自适应的调整文字块的大小,大幅减少文字块数量,提高编码效率,能够适应不同终端分辨率的要求。另外,编码过程中,通过对颜色相似的文字块统一进行编码,能够更有效地去除文字块间的颜色冗余信息,进一步达到提高编码效率的目的。
图6为本公开实施例提供的一种文字块的编码装置的另一个示意图,如图6所示,该文字块的编码装置10还包括:
处理模块105,用于在所述编码模块104对每一子类的文字块统一编码之前,对于每一子类文字块,确定该子类的基本色处于YUV色彩空间中的目标分量值;根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果。
在一个实施例中,所述处理模块105,具体用于对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述原始分量值与所述目标分量值的差值的绝对值是否小于或等于第二阈值;若所述绝对值小于或等于所述第二阈值,则将所述原始分量值量化为所述目标分量值;若所述绝对值大于所述第二阈值,则将所述原始分量值量化为逃逸色分量值。
在一个实施例中,所述处理模块105,具体用于对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述目标分量值所属的颜色值区间;确定所述原始分量值是否落于所述目标分量值的颜色值区间;若所述原始分量值落于所述目标分量值的颜色值区间,则将所述原始分量值量化为所述目标分量值;若所述原始分量值不落于所述目标分量值的颜色值区间,则将所述原始分量值量化为逃逸色分量值。
在一个实施例中,所述处理模块105,在根据所述目标分量值,量化该子类中每个文字块的原始分量值之后,还用于对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值的索引值;根据所述量化结果以及所述目标分量值的索引值,确定该子类的基本色码表、逃逸色码表以及预测索引码表。
在一个实施例中,所述编码模块104,具体用于对于每一子类,确定该子类中每个文字块的位置信息;根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
在一个实施例中,所述目标分量值包括Y目标分量值、U目标分量值和V目标分量值,相应的,所述原始分量值包括Y原始分量值、U原始分量值和V原始分量值。
基于上述图1对应的实施例中所描述的文字块编码方法,本公开实施例还提供一种计算机可读存储介质,例如,非临时性计算机可读存储介质可以是只读存储器(英文:Read Only Memory,ROM)、随机存取存储器(英文:Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储装置等。该存储介质上存储有计算机指令,用于执行上述图1对应的实施例中所描述的文字块编码方法,此处不再赘述。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种文字块编码方法,其特征在于,所述方法包括:
将屏幕视频中的一帧图像划分成M×N的宏块,将所述M×N的宏块分成图片块和文字块两类,M≥1,N≥1,且M和N均为整数;
将基本色个数相同、且所述基本色占比超过第一阈值的文字块划分为一类;
对于每一类文字块包含的多个文字块,将对应基本色所属的颜色值区间相同的文字块划分为一个子类;
对每一子类的文字块统一编码。
2.根据权利要求1所述的方法,其特征在于,所述对每一子类的文字块统一编码之前,还包括:
对于每一子类文字块,确定该子类的基本色处于YUV色彩空间中的目标分量值;
根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果,包括:
对于该子类中的每个文字块,确定该文字块的原始分量值;
确定所述原始分量值与所述目标分量值的差值的绝对值是否小于或等于第二阈值;
若所述绝对值小于或等于所述第二阈值,则将所述原始分量值量化为所述目标分量值;
若所述绝对值大于所述第二阈值,则将所述原始分量值量化为逃逸色分量值。
4.根据权利要求2所述的方法,其特征在于,所述根据所述目标分量值,量化该子类中每个文字块的分量值,以得到量化结果,包括:
对于该子类中的每个文字块,确定该文字块的原始分量值;
确定所述目标分量值所属的颜色值区间;
确定所述原始分量值是否落于所述目标分量值的颜色值区间;
若所述原始分量值落于所述目标分量值的颜色值区间,则将所述原始分量值量化为所述目标分量值;
若所述原始分量值不落于所述目标分量值的颜色值区间,则将所述原始分量值量化为逃逸色分量值。
5.根据权利要求2所述的方法,其特征在于,所述根据所述目标分量值,量化该子类中每个文字块的原始分量值之后,还包括:
对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值的索引值;
根据所述量化结果以及所述目标分量值的索引值,确定该子类的基本色码表、逃逸色码表以及预测索引码表。
6.根据权利要求5所述的方法,其特征在于,所述对每一子类的文字块统一编码,包括:
对于每一子类,确定该子类中每个文字块的位置信息;
根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
7.根据权利要求2~6任一项所述的方法,其特征在于,所述目标分量值包括Y目标分量值、U目标分量值和V目标分量值,相应的,所述原始分量值包括Y原始分量值、U原始分量值和V原始分量值。
8.一种文字块的编码装置,其特征在于,包括:
第一划分模块,用于将屏幕视频中的一帧图像划分成M×N的宏块,将所述M×N的宏块分成图片块和文字块两类,M≥1,N≥1,且M和N均为整数;
第二划分模块,用于将基本色个数相同、且所述基本色占比超过第一阈值的文字块划分为一类;
第三划分模块,用于对于每一类文字块包含的多个文字块,将对应基本色所属的颜色值区间相同的文字块划分为一个子类;
编码模块,用于每一子类的文字块统一编码。
9.根据权利8所述的装置,其特征在于,所述装置还包括:
处理模块,用于在所述编码模块对每一子类的文字块统一编码之前,对于每一子类文字块,确定该子类的基本色处于YUV色彩空间中的目标分量值;根据所述目标分量值,量化该子类中每个文字块的原始分量值,以得到量化结果。
10.根据权利要求9所述的装置,其特征在于,
所述处理模块,具体用于对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述原始分量值与所述目标分量值的差值的绝对值是否小于或等于第二阈值;若所述绝对值小于或等于所述第二阈值,则将所述原始分量值量化为所述目标分量值;若所述绝对值大于所述第二阈值,则将所述原始分量值量化为逃逸色分量值。
11.根据权利要求9所述的装置,其特征在于,
所述处理模块,具体用于对于该子类中的每个文字块,确定该文字块的原始分量值;确定所述目标分量值所属的颜色值区间;确定所述原始分量值是否落于所述目标分量值的颜色值区间;若所述原始分量值落于所述目标分量值的颜色值区间,则将所述原始分量值量化为所述目标分量值;若所述原始分量值不落于所述目标分量值的颜色值区间,则将所述原始分量值量化为逃逸色分量值。
12.根据权利要求9所述的装置,其特征在于,
所述处理模块,在根据所述目标分量值,量化该子类中每个文字块的原始分量值之后,还用于对于每一子类,确定该子类的的基本色处于YUV色彩空间中目标分量值的索引值;根据所述量化结果以及所述目标分量值的索引值,确定该子类的基本色码表、逃逸色码表以及预测索引码表。
13.根据权利要求12所述的装置,其特征在于,
所述编码模块,具体用于对于每一子类,确定该子类中每个文字块的位置信息;根据该子类的基本色码表、逃逸色码表、预测索引码表以及该子类中每个文字块的位置信息,对该子类的文字块统一编码。
14.根据权利要求9~13任一项所述的装置,其特征在于,所述目标分量值包括Y目标分量值、U目标分量值和V目标分量值,相应的,所述原始分量值包括Y原始分量值、U原始分量值和V原始分量值。
CN201710701332.6A 2017-08-16 2017-08-16 文字块编码方法及装置 Active CN107509079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710701332.6A CN107509079B (zh) 2017-08-16 2017-08-16 文字块编码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710701332.6A CN107509079B (zh) 2017-08-16 2017-08-16 文字块编码方法及装置

Publications (2)

Publication Number Publication Date
CN107509079A true CN107509079A (zh) 2017-12-22
CN107509079B CN107509079B (zh) 2019-09-27

Family

ID=60691443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710701332.6A Active CN107509079B (zh) 2017-08-16 2017-08-16 文字块编码方法及装置

Country Status (1)

Country Link
CN (1) CN107509079B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019210822A1 (zh) * 2018-05-02 2019-11-07 中兴通讯股份有限公司 视频编解码方法、装置、系统及存储介质
CN110460855A (zh) * 2019-07-22 2019-11-15 西安万像电子科技有限公司 图像处理方法及系统
CN110996127A (zh) * 2019-11-25 2020-04-10 西安万像电子科技有限公司 图像编解码方法、设备及系统
CN112929669A (zh) * 2021-01-21 2021-06-08 西安万像电子科技有限公司 图像编码及解码方法、装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103996211A (zh) * 2014-05-05 2014-08-20 小米科技有限责任公司 图像重定位方法及装置
CN104881886A (zh) * 2015-05-14 2015-09-02 大连民族学院 用链码编码彩色动画图像的方法
US20150304662A1 (en) * 2012-04-12 2015-10-22 Mediatek Singapore Pte. Ltd. Method and apparatus for block partition of chroma subsampling formats
CN105472392A (zh) * 2015-12-11 2016-04-06 钟炎培 基于渐进式文字块压缩的屏幕视频编解码方法及编解码器
CN106686384A (zh) * 2016-11-29 2017-05-17 苏睿 文字块的压缩方法和装置以及图像压缩方法和装置
CN106851280A (zh) * 2017-01-04 2017-06-13 苏睿 图像压缩的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150304662A1 (en) * 2012-04-12 2015-10-22 Mediatek Singapore Pte. Ltd. Method and apparatus for block partition of chroma subsampling formats
CN103996211A (zh) * 2014-05-05 2014-08-20 小米科技有限责任公司 图像重定位方法及装置
CN104881886A (zh) * 2015-05-14 2015-09-02 大连民族学院 用链码编码彩色动画图像的方法
CN105472392A (zh) * 2015-12-11 2016-04-06 钟炎培 基于渐进式文字块压缩的屏幕视频编解码方法及编解码器
CN106686384A (zh) * 2016-11-29 2017-05-17 苏睿 文字块的压缩方法和装置以及图像压缩方法和装置
CN106851280A (zh) * 2017-01-04 2017-06-13 苏睿 图像压缩的方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019210822A1 (zh) * 2018-05-02 2019-11-07 中兴通讯股份有限公司 视频编解码方法、装置、系统及存储介质
CN110446041A (zh) * 2018-05-02 2019-11-12 中兴通讯股份有限公司 一种视频编解码方法、装置、系统及存储介质
CN110446041B (zh) * 2018-05-02 2021-11-19 中兴通讯股份有限公司 一种视频编解码方法、装置、系统及存储介质
US11445201B2 (en) 2018-05-02 2022-09-13 Zte Corporation Video encoding and decoding method, device, and system, and storage medium
CN110460855A (zh) * 2019-07-22 2019-11-15 西安万像电子科技有限公司 图像处理方法及系统
CN110460855B (zh) * 2019-07-22 2023-04-18 西安万像电子科技有限公司 图像处理方法及系统
CN110996127A (zh) * 2019-11-25 2020-04-10 西安万像电子科技有限公司 图像编解码方法、设备及系统
CN110996127B (zh) * 2019-11-25 2022-12-09 西安万像电子科技有限公司 图像编解码方法、设备及系统
CN112929669A (zh) * 2021-01-21 2021-06-08 西安万像电子科技有限公司 图像编码及解码方法、装置

Also Published As

Publication number Publication date
CN107509079B (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
CN107509079A (zh) 文字块编码方法及装置
CN108062478A (zh) 全局特征可视化与局部特征相结合的恶意代码分类方法
KR100556832B1 (ko) 영상정보 검색을 위한 비선형 양자화 및 유사도 매칭 방법
US6438268B1 (en) Vector quantization codebook generation method
CN102881026B (zh) 一种具有透明度信息的图像的调色板装置与生成方法
CN109657715B (zh) 一种语义分割方法、装置、设备及介质
JP2005141758A5 (zh)
CN113542740B (zh) 图像传输方法及装置
CN102819582A (zh) 一种海量图片快速检索方法
CN103700121A (zh) 一种复合图像的压缩方法及装置
CN1411284A (zh) 取决于图像的面部检测方法
CN106851280B (zh) 图像压缩的方法和装置
CN110298898B (zh) 更改汽车图像车身颜色的方法及其算法结构
CN107545049A (zh) 图片处理方法及相关产品
CN111627080A (zh) 基于卷积神经与条件生成对抗性网络的灰度图像上色方法
CN108391132A (zh) 文字块编码方法及装置
CN107480723A (zh) 基于局部二进制阈值学习网络的纹理识别方法
CN105828081A (zh) 编码方法及编码装置
CN111127360A (zh) 一种基于自动编码器的灰度图像迁移学习方法
CN110276428A (zh) 一种四维码编码及解码方法
CN115860023A (zh) 基于二维码的卷烟设备管理方法、装置、电子设备及介质
CN106604032B (zh) 图像中文字块的压缩方法和装置及图像压缩方法和装置
CN101459854B (zh) 图像压缩编码/解码装置及图像压缩编码/解码方法
CN110490250A (zh) 一种人工智能训练集的获取方法及装置
Moussa et al. Forensic license plate recognition with compression-informed transformers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant