CN111476853A - 文字图像的编解码方法、设备及系统 - Google Patents
文字图像的编解码方法、设备及系统 Download PDFInfo
- Publication number
- CN111476853A CN111476853A CN202010185076.1A CN202010185076A CN111476853A CN 111476853 A CN111476853 A CN 111476853A CN 202010185076 A CN202010185076 A CN 202010185076A CN 111476853 A CN111476853 A CN 111476853A
- Authority
- CN
- China
- Prior art keywords
- image
- character
- font
- text
- font type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000005540 biological transmission Effects 0.000 abstract description 12
- 239000003086 colorant Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003707 image sharpening Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开提供一种文字图像的编解码方法、设备及系统,涉及编解码技术领域,能够解决现有文字图像传输数据量较大的问题。具体技术方案为:获取待处理文字图像;对待处理文字图像进行二值化处理,得到二值化图像;对二值化图像进行编码得到编码码流;在编码码流中添加字体标记信息得到目标编码码流,字体标记信息用于指示待处理文字图像中每个文字的字体类型;将目标编码码流发送给解码端设备。
Description
技术领域
本公开涉及编解码技术领域,尤其涉及文字图像的编解码方法、设备及系统。
背景技术
通过计算机生成的文字图像,虽然文字本身看起来是黑色的,但实际上文字边缘部分的像素点并不完全是黑色的,尤其是中国文字的斜、撇、捺等边缘往往有红黄等颜色,以达到视觉上的柔和。在这种情况下,当传输这些锐化后的文字图像时,所传输的像素点实际上并不完全是黑白两色,还包括比如红黄等其他颜色,因此,图像传输的数据量实际上是比较大的。
发明内容
本公开实施例提供一种文字图像的编解码方法、设备及系统,能够解决现有文字图像传输数据量较大的问题。所述技术方案如下:
根据本公开实施例的第一方面,提供一种文字图像的编码方法,该方法包括:
获取待处理文字图像;
对待处理文字图像进行二值化处理,得到二值化图像;
对二值化图像进行编码得到编码码流;
在编码码流中添加字体标记信息得到目标编码码流,字体标记信息用于指示待处理文字图像中每个文字的字体类型;
将目标编码码流发送给解码端设备。
通过对待处理图像进行二值化处理,能够大大降低编码端的码流,同时,由于编码码流中添加有字体标记信息,便于解码端设备根据字体标记信息对每个文字进行锐化恢复,这样,在保证文字图像能够被解码端进行恢复的同时,解决现有文字图像传输数据量较大的问题。
在一个实施例中,对待处理文字图像进行二值化处理,得到二值化图像包括:
对待处理文字图像进行灰度化处理,得到灰度图像;
计算灰度图像中所有像素点的平均灰度值,并将平均灰度值确定为灰度阈值;
将灰度图像中每个像素点的像素值与灰度阈值进行比较并进行二值化处理,得到二值化图像。
在一个实施例中,在编码码流中添加字体标记信息,得到目标编码码流之前,该方法还包括:
对待处理文字图像中每个文字的字体进行识别,得到每个文字的字体类型;
将每个文字的字体类型与预设的默认字体类型进行比较,并根据比较结果确定每个文字对应的字体标记位,得到字体标记信息。
在一个实施例中,根据比较结果确定每个文字对应的字体标记位,得到字体标记信息包括:
将字体类型与默认字体类型相同的文字不进行字体标记;
将字体类型与默认字体类型不相同的文字进行字体标记,得到字体标记信息。
在一个实施例中,对文字图像中每个文字的字体进行识别,得到每个文字的字体类型之前,方法还包括:
统计待处理文字图像中文字所使用的字体类型的频率;
将频率最高的字体类型确定为待处理文字图像的默认字体类型。
在一个实施例中,对待处理文字图像中每个文字的字体进行识别,得到每个文字的字体类型包括:
将待处理文字图像中每个文字与预设字库中字体类型进行对比,确定每个文字的字体类型;
或者,获取用户的操作指令,根据用户的操作指令识别每个文字的字体类型。
根据本公开实施例的第二方面,提供一种文字图像的解码方法,包括:
接收编码端设备发送的目标编码码流,目标编码码流为根据第一方面以及第一方面任意一个实施例所描述的文字图像的编码方法得到的;
对目标编码码流进行解码,得到解码图像和字体标记信息;
根据字体标记信息确定每个文字的字体类型;
根据每个文字的字体类型和文字锐化列表,对解码图像中每个文字进行锐化,得到还原的文字图像,文字锐化列表用于指示字体类型与锐化方法的对应关系。
本公开实施例提供的文字图像的解码方法,根据目标编码码流中的字体标记信息,确定每个字体的字体类型,并根据每个字体类型对应的锐化方法对相应的文字进行锐化,得到最终显示图像,这样,在保证文字图像能够被解码端进行恢复的同时,解决现有文字图像传输数据量较大的问题。
根据本公开实施例的第三方面,提供一种文字图像的编码设备,文字图像的编码设备包括处理器和存储器,存储器中存储有至少一条计算机指令,指令由处理器加载并执行以实现第一方面以及第一方面的任一实施例所描述的文字图像的编码方法中所执行的步骤。
根据本公开实施例的第四方面,提供一种文字图像的解码设备,文字图像的解码设备包括处理器和存储器,存储器中存储有至少一条计算机指令,指令由处理器加载并执行以实现第二方面以及第二方面的任一实施例所描述的文字图像的解码方法中所执行的步骤。
根据本公开实施例的第五方面,提供一种文字图像的编解码系统,包括第三方面所描述的文字图像的编码设备以及第四方面所描述的文字图像的解码设备。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开实施例提供的一种文字图像的编码方法的流程图;
图2是本公开实施例提供的一种文字图像的解码方法的流程图;
图3是本公开实施例提供的一种文字图像的编码设备的结构图;
图4是本公开实施例提供的一种文字图像的编码设备的结构图;
图5是本公开实施例提供的一种文字图像的编码设备的结构图;
图6是本公开实施例提供的一种文字图像的解码设备的结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开实施例提供一种文字图像的编码方法,如图1所示,该文字图像的编码方法包括以下步骤:
101、获取待处理文字图像。
在本公开实施例中,待处理文字图像指计算机生成的白底黑字的文字图像,由于图像锐化处理的原因,文字的边缘不只是黑色像素点。之所以出现这种情况,是因为文字图像在显示前经过了锐化以使得文字边缘原本的锯齿状变得更加平滑,锐化本身简单来说就是在文字边缘原本的锯齿状中间填充各种颜色的像素点以达到使文字边缘更加平滑的效果。
102、对待处理文字图像进行二值化处理,得到二值化图像。
在本公开实施例中,对待处理文字图像进行二值化处理,得到二值化图像包括:
对待处理文字图像进行灰度化处理,得到灰度图像;
计算灰度图像中所有像素点的平均灰度值,并将平均灰度值确定为灰度阈值;
将灰度图像中每个像素点的像素值与灰度阈值进行比较并进行二值化处理,得到二值化图像。
具体的,对待处理文字图像进行灰度化处理方法可以采用分量法、最大值法、平均值法或加权平均法,通过对待处理文字图像进行灰度化,得到灰度图像;进而,计算灰度图像中所有像素点的灰度值的平均值,即平均灰度值,将平均灰度值作为二值化处理时的灰度阈值;在得到灰度阈值后,将灰度图像中每个像素点的像素值与灰度阈值进行比较,将大于灰度阈值的像素点的像素值设置为255(即白色),将小于或等于灰度阈值的像素点的像素值设置为0(即黑色),这样,通过二值化处理,将待处理文字图像处理为纯黑白两色的文字图像。
当然,也可以根据经验预先设置灰度阈值,那么,在得到灰度图像后,直接将灰度图像中每个像素点的像素值与预先设置的灰度阈值进行比较,将大于灰度阈值的像素点的像素值设置为255(即白色),将小于或等于灰度阈值的像素点的像素值设置为0(即黑色),得到灰度图像。
103、对二值化图像进行编码得到编码码流。
在本公开实施例中,可以采用任意适用的文字编码器通过适当的文字编码算法对二值化图像进行编码,本公开对此不加任何限定。
104、在编码码流中添加字体标记信息,得到目标编码码流。
在本公开实施例中,字体标记信息用于指示待处理文字图像中每个文字的字体类型。
在步骤104之前,该方法还包括:对待处理文字图像中每个文字的字体进行识别,得到每个文字的字体类型;将每个文字的字体类型与预设的默认字体类型进行比较,并根据比较结果确定每个文字对应的字体标记位,得到字体标记信息。
通常情况下,可以根据实际需要和使用场景对默认字体类型进行设置,或者,通过对待处理文字图像中每个文字所使用的字体类型的频率进行统计,将频率最高的字体类型确定为待处理文字图像的默认字体类型。在确定好默认字体类型后,将待处理文字图像中每个文字的字体类型与默认字体类型依次进行比较,根据比较结果确定每个文字对应的字体标记位。
对于根据比较结果确定每个文字对应的字体标记位的方式包含下述两种情况,下面举例进行描述。
在第一种情况下,将待处理文字图像中每个文字的字体类型与默认字体类型进行比较,将与默认字体类型相同的文字的字体类型标记为第一标识,将与默认字体类型不相同的文字的字体类型标记为第二标识,这样,待处理文字图像中的每个文字都有各自对应的字体标记位,通过字体标记位可以明确该文字所对应的字体类型。
在第二种情况下,将待处理文字图像中每个文字的字体类型与默认字体类型进行比较,将字体类型与默认字体类型相同的文字不进行标记,将字体类型与默认字体类型不相同的文字进行标记,得到字体标记信息。在这种情况下,字体标记信息中包含有待处理文字图像的默认字体类型,以及,与默认字体类型不相同的文字的字体标记位。当然,字体标记位可以包含该文字所在的位置。
以默认字体类型为待处理文字图像中频率最高的字体类型为例,对上述第一种情况和第二种情况进行分别说明。在第一种情况下,字体标记信息中包含每个文字的字体类型,但是,与第二种情况相比,第一种情况下的字体标记信息的数据量较大,需要将每个文字的字体类型进行标记,而在第二种情况下,只需要将与默认字体类型不相同的文字均进行标记即可,由于未标记的文字的字体类型与默认字体类型相同,因此,只需要在字体标记信息中包含默认字体类型的信息。
105、将目标编码码流发送给解码端设备。
本公开实施例提供的文字图像的编码方法,通过对待处理图像进行二值化处理,能够大大降低编码端的码流,同时,由于编码码流中添加有字体标记信息,便于解码端设备根据字体标记信息对每个文字进行锐化恢复,这样,在保证文字图像能够被解码端进行恢复的同时,解决现有文字图像传输数据量较大的问题。
基于上述图1对应的实施例提供的文字图像的编码方法,本公开另一实施例提供一种文字图像的解码方法,该方法可以应用于解码端设备,参照图2所示,本实施例提供的文字图像的解码方法包括以下步骤:
201、接收编码端设备发送的目标编码码流。
目标编码码流是根据图1对应的实施例所提供的文字图像的编码方法得到的,目标编码码流包括二值化图像编码后的编码码流和字体标记信息,字体标记信息用于指示待处理文字图像中每个文字的字体类型,和/或待处理文字图像的默认字体类型。
202、对目标编码码流进行解码,得到解码图像和字体标记信息。
在本公开实施例中,从目标编码码流中提取字体标记信息,然后按照与编码端设备所使用的的文字编码方法相对应的文字解码方法对编码码流进行解码,得到解码图像,解码图像即步骤102中所描述的二值化图像。
203、根据字体标记信息确定每个文字的字体类型。
在字体标记信息用于指示每个文字的字体类型时,可以根据字体标记信息直接得到每个文字的字体类型;在字体标记信息用于指示待处理文字图像的默认字体类型和与默认字体类型不同的文字的字体标记位时,对于无字体标记位的文字,意味着该文字的字体类型为默认字体类型,对于有字体标记位的文字,根据字体标记位确定该文字的字体类型。
204、根据每个文字的字体类型以及文字锐化列表,对解码图像中的每个文字进行锐化,得到还原的文字图像。
文字锐化列表用于指示字体类型与锐化方法的对应关系,也就是说,每个字体类型都有各自对应的锐化方法。具体的,由于解码的二值化图像中文字边缘部分呈现锯齿状,因此,在获取到每个文字的字体类型后,根据对应的锐化方法对相应的文字进行锐化,从而得到还原的文字图像,即最终显示给用户的图像。
本公开实施例提供的文字图像的解码方法,根据目标编码码流中的字体标记信息,确定每个字体的字体类型,并根据每个字体类型对应的锐化方法对相应的文字进行锐化,得到最终显示图像,这样,在保证文字图像能够被解码端进行恢复的同时,解决现有文字图像传输数据量较大的问题。
基于上述图1对应的实施例提供的文字图像的编码方法和图2对应的实施例提供的文字图像的解码方法,本公开另一实施例提供一种文字图像的编解码方法,其主要思路为:在编码端对文字图像进行二值化处理得到二值化图像,对二值化图像进行编码并在码流中添加字体标记信息;在解码端对编码图像进行解码后,根据编码码流中的字体标记信息确定各个文字的字体类型;在确定各个文字的字体类型之后,根据相应字体类型所对应的锐化方法对相应文字进行锐化,从而得到最终显示图像。
下面通过一个具体实施例,对本发明上述方案做以下详细说明。
一、编码端的处理流程,主要包括以下步骤:
步骤31、对文字图像进行二值化处理得到二值化图像。
文字图像是指计算机生成的白底黑字的文字图像,由于图像锐化处理的原因,文字的边缘不只是黑色像素点。
具体的,二值化处理可以包括:对文字图像进行灰度处理得到灰度图;将大于灰度阈值的像素点的像素值设置为255,将小于等于灰度阈值的像素点的像素值设置为0。
其中,灰度阈值可以是根据经验所设置的一个固定值(该取值可以调整),也可以是当前灰度图像的平均灰度值。如果灰度阈值为当前灰度图像的平均灰度值,则需要在得到灰度图之后,计算当前灰度图的平均灰度值,然后将平均灰度值确定为灰度阈值,之后,再进行后续的像素值调整。
按照上述方案进行二值化处理后,将得到纯黑白两色的文字图片,该文字图片中,由于二值化处理过滤掉了文字边缘部分像素点,因此,文字边缘将出现锯齿状。
步骤32、对二值化图像进行编码得到编码码流。
该步骤中,可以采用任意适用的文字编码器通过适当的文字编码算法对二值化图像进行编码。
步骤33、在编码码流中添加字体标记位。
其中,字体标记位用于标记当前文字图像中文字所使用的字体。
具体的,在编码码流中添加字体标记位,包括:
预先设置默认字体;对文字图像中的各个文字的字体进行识别,如果与默认字体相同,则不进行标记;如果与默认字体不相同,则对相应文字的字体进行标记。
通常情况下,可以根据实际需要和使用场景对默认字体进行设置;或者,通过对当前文字图像中各个文字所使用的字体的出现频率进行统计,将出现频率最高的字体作为当前文字图像的默认字体。在这种情况下,需要在编码码流中加入一个默认字体标记位用于标记整帧文字图像的默认字体。如果所有文字图像中的字体使用相对规律的情况下,可以预设一种字体,比如宋体,作为默认字体,在这种情况下,可以不在编码码流中增加默认字体标记位,而编码端和解码端则直接以宋体作为默认字体来对所有图像进行处理。
在一种可选实施方式中,在编码码流中添加字库标记位之前,该方法还包括:确定当前文字图像中的文字所使用的字体。
对于确定当前文字图像中的文字所使用的字体,可以根据使用场景的不同有不同的处理方案。其主要场景有以下两种:一种是云桌面或者桌面虚拟化场景中的桌面图像传输,另一种是普通图像编码传输场景。
在使用场景为云桌面或者桌面虚拟化场景中的桌面图像传输时,当前所处理的文字图像即是由服务器根据用户操作所生成的桌面图像或者桌面图像的一部分,该图像用于由服务器编码后发送给客户端或者零终端。因此,可以由当前服务器根据用户当前所执行的操作指令来识别用户当前所使用的字体。
在使用场景为普通图像编码传输场景时,编码端可以对当前图像中的文字进行识别,以确定其对应的字体。具体的,将当前图像中的文字在字库中进行对比,从而确定当前文字所采用的字体。
步骤34、将添加了字体标记位的编码码流发送给解码端,由解码端进行解码。
二、解码端的处理流程,主要包括以下步骤:
步骤41、接收解码端发送的添加了字体标记位的编码码流。
步骤41中的编码码流是指上述步骤33中所得到的编码码流。
步骤42、对编码码流进行解码。
具体的,按照与编码图像所使用的文字编码方法相对应的文字解码方法对当前编码码流进行解码。解码后得到的图像即是步骤31中所处理得到的的二值化图像,由于二值化图像中文字边缘部分呈现锯齿状,因此,这些二值化图像不能直接显示给用户,还需要进一步进行锐化处理。
步骤43、根据编码码流中的字体标记情况确定各个文字的字体类型。
对于无字体标记位的文字,其字体类型为默认字体类型;对于有字体标记位的文字,其字体类型为字体标记位所标记的字体类型。
步骤44、确定各个文字的字体类型之后,根据相应字体类型所对应的锐化方法对相应文字进行锐化,从而得到最终显示图像。
在本公开实施例中,不同字体有其对应的锐化方法,当确定各个文字的字体类型之后,可以根据对应的锐化方法对相对应文字进行锐化。具体的,对于无字体标记的文字,按照默认字体的锐化方式进行锐化;对于有字体标记的文字,按照该字体标记所对应的字体的锐化方式进行锐化。当完成对整个二值化图像中所有文字的锐化之后,即得到最终显示图像。
本公开实施例提供的文字图像的编解码方法,在编码端对文字图像进行二值化处理得到二值化图像,对二值化图像进行编码并在码流中添加字体标记信息;在解码端对编码图像进行解码后,根据编码码流中的字体标记情况确定各个文字的字体类型;确定各个文字的字体类型之后,根据相应字体类型所对应的锐化方法对相应文字进行锐化,从而得到最终显示图像。上述方案,通过在解码端对图像进行二值化处理,能够大大降低编码端的码流,同时,由于编码码流中添加有字体标记信息,通过该字体标记信息,解码端能够确定各个文字的字体,并基于各种字体所对应的锐化方式对相应文字进行锐化处理,使得文字图像恢复到正常的显示效果,不影响用户的观看。
基于上述图1对应的实施例中所描述的文字图像的编码方法,下述为本公开装置实施例,可以用于执行本公开方法实施例。
本公开实施例提供一种文字图像的编码设备,如图3所示,该文字图像的编码设备30包括:
获取模块301,用于获取待处理文字图像;
处理模块302,用于对待处理文字图像进行二值化处理,得到二值化图像;
编码模块303,用于对二值化图像进行编码得到编码码流;
添加模块304,用于在编码码流中添加字体标记信息得到目标编码码流,字体标记信息用于指示待处理文字图像中每个文字的字体类型;
发送模块305,用于将目标编码码流发送给解码端设备。
在一个实施例中,如图4所示,处理模块302包括:灰度化处理子模块3021、计算子模块3022、二值化处理模块3023;
灰度化处理子模块3021,用于对待处理文字图像进行灰度化处理,得到灰度图像;
计算子模块3022,用于计算灰度图像中所有像素点的平均灰度值,并将平均灰度值确定为灰度阈值;
二值化处理模块3023,用于将灰度图像中每个像素点的像素值与灰度阈值进行比较并进行二值化处理,得到二值化图像。
如图5所示,文字图像的编码设备30还包括:识别模块306、确定模块307和统计模块308;
在一个实施例中,识别模块306,用于对待处理文字图像中每个文字的字体进行识别,得到每个文字的字体类型;
确定模块307,用于将每个文字的字体类型与预设的默认字体类型进行比较,并根据比较结果确定每个文字对应的字体标记位,得到字体标记信息。
在一个实施例中,确定模块307,用于将字体类型与默认字体类型相同的文字不进行字体标记;将字体类型与默认字体类型不相同的文字进行字体标记,得到字体标记信息。
在一个实施例中,统计模块308,用于统计待处理文字图像中文字所使用的字体类型的频率;
确定模块307,用于将频率最高的字体类型确定为待处理文字图像的默认字体类型。
在一个实施例中,识别模块306,用于将待处理文字图像中每个文字与预设字库中字体类型进行对比,确定每个文字的字体类型;
或者,识别模块306,用于获取用户的操作指令,根据用户的操作指令识别每个文字的字体类型。
本公开实施例提供的文字图像的编码方法,通过对待处理图像进行二值化处理,能够大大降低编码端的码流,同时,由于编码码流中添加有字体标记信息,便于解码端设备根据字体标记信息对每个文字进行锐化恢复,这样,在保证文字图像能够被解码端进行恢复的同时,解决现有文字图像传输数据量较大的问题。
本公开实施例还提供了一种文字图像的编码设备,该文字图像的编码设备包括接收器、发射器、存储器和处理器,该发射器和存储器分别与处理器连接,存储器中存储有至少一条计算机指令,处理器用于加载并执行至少一条计算机指令,以实现上述图1对应的实施例中所描述的文字图像的编码方法。
基于上述图1对应的实施例中所描述的文字图像的编码方法,本公开实施例还提供一种计算机可读存储介质,例如,非临时性计算机可读存储介质可以是只读存储器(英文:Read Only Memory,ROM)、随机存取存储器(英文:Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储装置等。该存储介质上存储有计算机指令,用于执行上述图1对应的实施例中所描述的文字图像的编码方法,此处不再赘述。
基于上述图2对应的实施例中所描述的文字图像的解码方法,下述为本公开装置实施例,可以用于执行本公开方法实施例。
本公开实施例提供一种文字图像的解码设备,如图6所示,该文字图像的解码设备60包括:
接收模块601,用于接收编码端设备发送的目标编码码流;
解码模块602,用于对目标编码码流进行解码,得到解码图像和字体标记信息;
确定模块603,用于根据字体标记信息确定每个文字的字体类型;
锐化模块604,用于根据每个文字的字体类型和文字锐化列表,对解码图像中每个文字进行锐化,得到还原的文字图像,文字锐化列表用于指示字体类型与锐化方法的对应关系。
本公开实施例提供的文字图像的解码方法,根据目标编码码流中的字体标记信息,确定每个字体的字体类型,并根据每个字体类型对应的锐化方法对相应的文字进行锐化,得到最终显示图像,这样,在保证文字图像能够被解码端进行恢复的同时,解决现有文字图像传输数据量较大的问题。
本公开实施例还提供了一种文字图像的解码设备,该文字图像的解码设备包括接收器、发射器、存储器和处理器,该发射器和存储器分别与处理器连接,存储器中存储有至少一条计算机指令,处理器用于加载并执行至少一条计算机指令,以实现上述图2对应的实施例中所描述的文字图像的解码方法。
基于上述图2对应的实施例中所描述的文字图像的解码方法,本公开实施例还提供一种计算机可读存储介质,例如,非临时性计算机可读存储介质可以是只读存储器(英文:Read Only Memory,ROM)、随机存取存储器(英文:Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储装置等。该存储介质上存储有计算机指令,用于执行上述图2对应的实施例中所描述的文字图像的解码方法,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
Claims (10)
1.一种文字图像的编码方法,其特征在于,所述方法包括:
获取待处理文字图像;
对所述待处理文字图像进行二值化处理,得到二值化图像;
对所述二值化图像进行编码得到编码码流;
在所述编码码流中添加字体标记信息得到目标编码码流,所述字体标记信息用于指示所述待处理文字图像中每个文字的字体类型;
将所述目标编码码流发送给解码端设备。
2.根据权利要求1所述的方法,其特征在于,所述在所述编码码流中添加字体标记信息,得到目标编码码流之前,所述方法还包括:
对所述待处理文字图像中每个文字的字体进行识别,得到每个文字的字体类型;
将所述每个文字的字体类型与预设的默认字体类型进行比较,并根据比较结果确定每个文字对应的字体标记位,得到所述字体标记信息。
3.根据权利要求2所述的方法,其特征在于,所述根据比较结果确定每个文字对应的字体标记位,得到所述字体标记信息包括:
将字体类型与所述默认字体类型相同的文字不进行字体标记;
将字体类型与所述默认字体类型不相同的文字进行字体标记,得到字体标记信息。
4.根据权利要求2所述的方法,其特征在于,所述对所述文字图像中每个文字的字体进行识别,得到每个文字的字体类型之前,所述方法还包括:
统计所述待处理文字图像中文字所使用的字体类型的频率;
将频率最高的字体类型确定为所述待处理文字图像的默认字体类型。
5.根据权利要求2所述的方法,其特征在于,所述对所述待处理文字图像中每个文字的字体进行识别,得到每个文字的字体类型包括:
将所述待处理文字图像中每个文字与预设字库中字体类型进行对比,确定所述每个文字的字体类型;
或者,获取用户的操作指令,根据所述用户的操作指令识别所述每个文字的字体类型。
6.根据权利要求1所述的方法,其特征在于,所述对所述待处理文字图像进行二值化处理,得到二值化图像包括:
对所述待处理文字图像进行灰度化处理,得到灰度图像;
计算所述灰度图像中所有像素点的平均灰度值,并将所述平均灰度值确定为灰度阈值;
将所述灰度图像中每个像素点的像素值与所述灰度阈值进行比较并进行二值化处理,得到所述二值化图像。
7.一种文字图像的解码方法,其特征在于,包括:
接收编码端设备发送的目标编码码流,所述目标编码码流为根据权利要求1~6任一项所述的文字图像的编码方法得到的;
对所述目标编码码流进行解码,得到解码图像和字体标记信息;
根据所述字体标记信息确定每个文字的字体类型;
根据所述每个文字的字体类型和文字锐化列表,对解码图像中每个文字进行锐化,得到还原的文字图像,所述文字锐化列表用于指示字体类型与锐化方法的对应关系。
8.一种文字图像的编码设备,其特征在于,包括处理器和存储器,所述存储器中存储有至少一条计算机指令,所述指令由所述处理器加载并执行以实现权利要求1至权利要求6任一项所述的文字图像的编码方法中所执行的步骤。
9.一种文字图像的解码设备,其特征在于,包括处理器和存储器,所述存储器中存储有至少一条计算机指令,所述指令由所述处理器加载并执行以实现权利要求7所述的文字图像的解码方法中所执行的步骤。
10.一种文字图像的编解码系统,其特征在于,包括:权利要求8所述的文字图像的编码设备和权利要求9所述的文字图像的解码设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010185076.1A CN111476853B (zh) | 2020-03-17 | 2020-03-17 | 文字图像的编解码方法、设备及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010185076.1A CN111476853B (zh) | 2020-03-17 | 2020-03-17 | 文字图像的编解码方法、设备及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111476853A true CN111476853A (zh) | 2020-07-31 |
CN111476853B CN111476853B (zh) | 2024-05-24 |
Family
ID=71747629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010185076.1A Active CN111476853B (zh) | 2020-03-17 | 2020-03-17 | 文字图像的编解码方法、设备及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111476853B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112104872A (zh) * | 2020-08-17 | 2020-12-18 | 西安万像电子科技有限公司 | 图像传输方法及装置 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224390A (zh) * | 2015-09-22 | 2016-01-06 | 宁夏大学 | 一种虚拟桌面压缩的方法 |
CN106022011A (zh) * | 2016-05-30 | 2016-10-12 | 合欢森林网络科技(北京)有限公司 | 基于图像的保密信息传播方法、装置和系统 |
CN106325750A (zh) * | 2016-08-26 | 2017-01-11 | 曹蕊 | 一种应用于终端设备的文字识别方法及系统 |
CN107483934A (zh) * | 2017-08-17 | 2017-12-15 | 西安万像电子科技有限公司 | 编解码方法、装置和系统 |
CN107705339A (zh) * | 2017-10-18 | 2018-02-16 | 广东小天才科技有限公司 | 一种压缩方法及装置 |
CN107862315A (zh) * | 2017-11-02 | 2018-03-30 | 腾讯科技(深圳)有限公司 | 字幕提取方法、视频搜索方法、字幕分享方法及装置 |
CN108319945A (zh) * | 2018-01-09 | 2018-07-24 | 佛山科学技术学院 | 一种分离式ocr识别方法及其系统 |
CN108763350A (zh) * | 2018-05-15 | 2018-11-06 | Oppo广东移动通信有限公司 | 文本数据处理方法、装置、存储介质及终端 |
CN110032716A (zh) * | 2019-04-17 | 2019-07-19 | 北京地平线机器人技术研发有限公司 | 文字编码方法和装置、可读存储介质及电子设备 |
CN110070042A (zh) * | 2019-04-23 | 2019-07-30 | 北京字节跳动网络技术有限公司 | 文字识别方法、装置和电子设备 |
CN110197238A (zh) * | 2019-04-15 | 2019-09-03 | 广州企图腾科技有限公司 | 一种字体类别的识别方法、系统及终端设备 |
CN110246197A (zh) * | 2019-05-21 | 2019-09-17 | 北京奇艺世纪科技有限公司 | 验证码字符生成方法、装置、电子设备及存储介质 |
US20190306367A1 (en) * | 2018-03-28 | 2019-10-03 | Xerox Corporation | Machine readable security mark and process for generating same |
CN110446041A (zh) * | 2018-05-02 | 2019-11-12 | 中兴通讯股份有限公司 | 一种视频编解码方法、装置、系统及存储介质 |
WO2019232852A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写字训练样本获取方法、装置、设备及介质 |
CN110795258A (zh) * | 2018-07-17 | 2020-02-14 | 珠海金山办公软件有限公司 | 字体库匹配方法、装置及设备 |
-
2020
- 2020-03-17 CN CN202010185076.1A patent/CN111476853B/zh active Active
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224390A (zh) * | 2015-09-22 | 2016-01-06 | 宁夏大学 | 一种虚拟桌面压缩的方法 |
CN106022011A (zh) * | 2016-05-30 | 2016-10-12 | 合欢森林网络科技(北京)有限公司 | 基于图像的保密信息传播方法、装置和系统 |
CN106325750A (zh) * | 2016-08-26 | 2017-01-11 | 曹蕊 | 一种应用于终端设备的文字识别方法及系统 |
CN107483934A (zh) * | 2017-08-17 | 2017-12-15 | 西安万像电子科技有限公司 | 编解码方法、装置和系统 |
CN107705339A (zh) * | 2017-10-18 | 2018-02-16 | 广东小天才科技有限公司 | 一种压缩方法及装置 |
CN107862315A (zh) * | 2017-11-02 | 2018-03-30 | 腾讯科技(深圳)有限公司 | 字幕提取方法、视频搜索方法、字幕分享方法及装置 |
CN108319945A (zh) * | 2018-01-09 | 2018-07-24 | 佛山科学技术学院 | 一种分离式ocr识别方法及其系统 |
US20190306367A1 (en) * | 2018-03-28 | 2019-10-03 | Xerox Corporation | Machine readable security mark and process for generating same |
CN110321084A (zh) * | 2018-03-28 | 2019-10-11 | 施乐公司 | 机器可读安全标记及其生成过程 |
CN110446041A (zh) * | 2018-05-02 | 2019-11-12 | 中兴通讯股份有限公司 | 一种视频编解码方法、装置、系统及存储介质 |
CN108763350A (zh) * | 2018-05-15 | 2018-11-06 | Oppo广东移动通信有限公司 | 文本数据处理方法、装置、存储介质及终端 |
WO2019232852A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写字训练样本获取方法、装置、设备及介质 |
CN110795258A (zh) * | 2018-07-17 | 2020-02-14 | 珠海金山办公软件有限公司 | 字体库匹配方法、装置及设备 |
CN110197238A (zh) * | 2019-04-15 | 2019-09-03 | 广州企图腾科技有限公司 | 一种字体类别的识别方法、系统及终端设备 |
CN110032716A (zh) * | 2019-04-17 | 2019-07-19 | 北京地平线机器人技术研发有限公司 | 文字编码方法和装置、可读存储介质及电子设备 |
CN110070042A (zh) * | 2019-04-23 | 2019-07-30 | 北京字节跳动网络技术有限公司 | 文字识别方法、装置和电子设备 |
CN110246197A (zh) * | 2019-05-21 | 2019-09-17 | 北京奇艺世纪科技有限公司 | 验证码字符生成方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
LING-QUN ZUO, ET AL: "Natural Scene Text Recognition Based on Encoder-Decoder Framework", 《IEEE ACCESS》, pages 62616 - 62623 * |
段崇雯 等: "一种基于二值化和亚采样的文本图像压缩方法", 《计算机应用》, vol. 25, no. 1, pages 93 - 95 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112104872A (zh) * | 2020-08-17 | 2020-12-18 | 西安万像电子科技有限公司 | 图像传输方法及装置 |
CN112104872B (zh) * | 2020-08-17 | 2024-05-17 | 西安万像电子科技有限公司 | 图像传输方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111476853B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110310343B (zh) | 图像处理方法及装置 | |
CN105391972B (zh) | 图像通信设备、图像发送设备和图像接收设备 | |
EP3560203B1 (en) | Method and apparatus for embedding key information in an image | |
CN112714309A (zh) | 视频质量评估方法、装置、设备、介质及程序产品 | |
CN109862365B (zh) | 图像数据处理方法及装置 | |
CN110149515B (zh) | 数据传输方法及装置 | |
CN109995964B (zh) | 图像数据处理方法及装置 | |
CN110740316A (zh) | 数据编码方法及装置 | |
CN110636334B (zh) | 数据传输方法及系统 | |
CN111476853B (zh) | 文字图像的编解码方法、设备及系统 | |
CN113452996B (zh) | 一种视频编码、解码方法及装置 | |
CN111639545A (zh) | 一种人脸识别方法、装置、设备及介质 | |
CN108600755B (zh) | 图像帧编码方法及装置 | |
US7634105B2 (en) | Method and apparatus for embedding information in imaged data, printed material, and computer product | |
CN110581995A (zh) | 一种视频处理的方法及装置 | |
CN112104872B (zh) | 图像传输方法及装置 | |
CN111882491A (zh) | 文字图像编解码方法、设备和系统 | |
CN115171110B (zh) | 文本识别方法及装置、设备、介质和产品 | |
CN117058700B (zh) | 答题卡识别方法、装置、设备和存储介质 | |
CN114627198A (zh) | 数据处理方法及装置 | |
CN111526364A (zh) | 图像处理的方法、装置和系统 | |
CN113554594A (zh) | 一种图像中文字区域的编解码方法及装置 | |
CN111556317A (zh) | 编码方法、装置及编解码系统 | |
CN111966282A (zh) | 数据存储访问控制方法及系统 | |
CN111831366A (zh) | 一种图像数据的发送方法、装置及相关组件 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |