CN105338360A - 图像解码方法及装置 - Google Patents

图像解码方法及装置 Download PDF

Info

Publication number
CN105338360A
CN105338360A CN201410293058.XA CN201410293058A CN105338360A CN 105338360 A CN105338360 A CN 105338360A CN 201410293058 A CN201410293058 A CN 201410293058A CN 105338360 A CN105338360 A CN 105338360A
Authority
CN
China
Prior art keywords
value
component value
pixel
image
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410293058.XA
Other languages
English (en)
Other versions
CN105338360B (zh
Inventor
喻世江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Ucweb Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ucweb Inc filed Critical Ucweb Inc
Priority to CN201410293058.XA priority Critical patent/CN105338360B/zh
Priority to PCT/CN2014/091926 priority patent/WO2015196717A1/zh
Publication of CN105338360A publication Critical patent/CN105338360A/zh
Application granted granted Critical
Publication of CN105338360B publication Critical patent/CN105338360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开的图像解码方法,包括:获取图像的编码数据;按照第一解码规则对所述编码数据进行解码,得到所述图像的像素数据;根据像素数据识别图像中的灰阶像素;当所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对所述编码数据重新解码。本发明还提供了一种图像解码装置。本发明所提供的图像解码方法及装置,与现有技术相比,对网页中的图像在降低采样解码后,识别出以文字为主的图像,并对识别出的图像重新解码,既能够减少图像所占用的系统资源,又能够保证图像中的文字清楚的显示。

Description

图像解码方法及装置
技术领域
本发明涉及移动通信技术领域,更具体而言,涉及一种图像解码方法及装置。
背景技术
在终端设备上浏览网页时,首先,终端设备从服务器获取网页的资源数据,并保存所获取的资源数据,然后,解析资源数据形成网页信息,最后,终端设备通过浏览器展示网页信息。其中,在解析资源数据形成网页信息的过程中,网页信息需要占用部分系统资源。如果网页信息占用的系统资源过多,可能造成系统资源不足,导致终端设备的部分程序中止运行或死机,影响终端设备的正常运行。
通常,在网页资源数据中,图像占用的系统资源较多,为了减少图像占用的系统资源,在解析图像时,一般通过降低采样的方式解码图像。例如,一张原高宽为1000*1000像素的JPEG图像,解码时,从第一个像素开始,每次读取该图像中相邻的两个像素,并对所读取的两个像素进行运算,根据运算结果取一个像素,解码形成500*500像素的图像,从而减少图像对系统资源的占用。其中,上述运算可以是取两个像素R分量值、G分量值和B分量值的平均值。
然而,通过降低采样的方式解码,会降低图像的清晰度,对于一些以文字为主的图像,例如,微博、图片小说、漫画等,若以缩小图像尺寸的方式显示图像,可能无法看清楚文字的具体内容;若通过放大缩小后的图像的尺寸显示图像,由于清晰度降低,图像中的文字显示为模糊的灰色区域,依然无法清楚的识别出文字的具体内容。因此,通过降低采样的方式,导致图像中的文字难以识别,使得用户无法正常浏览网页,降低了用户的体验。
发明内容
有鉴于此,本发明实施例提供一种图像解码方法及装置,既能够减少图像所占用的系统资源,又能够保证图像中的文字清楚的显示,从而提高用户体验。
第一方面,本发明实施例提供了一种图像解码方法,所述方法包括:获取图像的编码数据;按照第一解码规则对所述编码数据进行解码,得到所述图像的像素数据;根据像素数据识别图像中的灰阶像素;当所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对所述编码数据重新解码。
在第一方面的第一种可能的实现方式中,所述根据像素数据识别图像中的灰阶像素,包括:读取目标像素;根据像素数据确定所述目标像素的性质;当所述目标像素为灰阶像素时,执行将灰阶像素的数量值加一的操作;判断灰阶像素的数量值是否等于预设阈值;如果灰阶像素的数量值等于预设阈值,将所述数量值确定为总数量值;如果灰阶像素的数量值小于预设阈值,按照预设规则读取下一个目标像素。
结合上述第一方面,在第二种可能的实现方式中,当根据素数据确定目标像素不是灰阶像素时,则认为所述目标像素为彩色像素,执行将彩色像素的数量值加一的操作;判断灰阶像素的数量是否等于预设阈值之前,所述方法还包括:判断彩色像素的数量值是否大于彩色像素的临界阈值;如果彩色像素的数量值大于所述临界阈值,结束操作;如果彩色像素的数量值小于或者等于临界阈值,执行判断灰阶像素的数量值是否等于预设阈值的步骤。
结合上述第一方面,在第三种可能的实现方式中,根据像素数据确定所述目标像素的性质包括:获取所述目标像素的R分量值、G分量值和B分量值;计算R分量值、G分量值和B分量值两两之间的差,得到三个差值;当三个差值的绝对值之和不大于预设容差时,将目标像素确定为灰阶像素。
结合上述第一方面,在第四种可能的实现方式中,所述计算R分量值、G分量值和B分量值两两之间的差,得到三个差值,包括:获取R分量值、G分量值与B分量值的比特位数量;判断R分量值、G分量值与B分量值的比特位数量是否相等;如果R分量值、G分量值与B分量值的比特位数量相等,执行计算R分量值、G分量值和B分量值两两之间的差,得到三个差值的步骤;如果R分量值、G分量值与B分量值的比特位数量不相等,将R分量值、G分量值与B分量值转换为相同的比特位数量,并按照转换后的分量值执行计算R分量值、G分量值和B分量值两两之间的差,得到三个差值的步骤。
第二方面,本发明实施例还提供了一种图像解码装置,所述装置包括:获取单元:用于获取图像的编码数据;第一解码单元:用于按照第一解码规则对所述获取单元获取的编码数据进行解码,得到所述图像的像素数据;识别单元:用于根据所述第一解码单元解码得到的像素数据识别图像中的灰阶像素;第二解码单元:用于当所述识别单元所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对所述编码数据重新解码。
在第二方面的第一种可能的实现方式中,所述识别单元包括:读取子单元、第一确定子单元、执行子单元、第一判断子单元及第二确定子单元,其中,所述读取子单元,用于读取目标像素;所述第一确定子单元:用于根据像素数据确定所述目标像素的性质;所述执行子单元,用于当第一确定子单元确定所述目标像素为灰阶像素时,执行将灰阶像素的数量值加一的操作;所述第一判断子单元,用于判断灰阶像素的数量值是否等于预设阈值;所述第二确定子单元:用于当灰阶像素的数量值等于预设阈值时,将所述数量值确定为总数量值;所述读取子单元,还用于当灰阶像素的数量值小于预设阈值时,按照预设规则读取下一个目标像素。
结合上述第二方面,在第二种可能的实现方式中,所述识别单元还包括:第二判断子单元,用于判断彩色像素的数量值是否大于彩色像素的临界阈值;所述第一判断子单元:还用于当彩色像素的数量值小于或者等于临界阈值时,判断灰阶像素的数量值是否等于预设阈值。
结合上述第二方面,在第三种可能的实现方式中,所述第一确定子单元还包括:获取模块、计算模块及确定模块,其中,所述获取模块,用于获取所述目标像素的R分量值、G分量值和B分量值;所述计算模块:计算R分量值、G分量值和B分量值两两之间的差,得到三个差值;所述确定模块:用于当三个差值的绝对值之和不大于预设容差时,将目标像素确定为灰阶像素。
结合上述第二方面,在第四种可能的实现方式中,所述计算模块包括:获取子模块、判断子模块及转换子模块,其中,所述获取子模块:用于获取R分量值、G分量值与B分量值的比特位数量;所述判断子模块:判断R分量值、G分量值与B分量值的比特位数量是否相等;所述计算模块,还用于当R分量值、G分量值与B分量值的比特位数量相等时,计算R分量值、G分量值和B分量值两两之间的差;所述转换子模块:用于当R分量值、G分量值与B分量值的比特位数量不相等时,将R分量值、G分量值与B分量值转换为相同的比特位数量;所述计算模块,还用于按照转换后的分量值执行计算R分量值、G分量值和B分量值两两之间的差。
由于图像中的文字由灰阶像素组成,本发明所提供的图像解码方法及装置,在获取到图像的编码数据之后,按照第一解码规则解码得到图像的像素数据,从而减少图像所占用的系统资源;然后通过图像的像素数据识别图像中的灰阶像素,如果灰阶像素的总数量值大于或者等于预设阈值时,则认为该图像以文字为主,对该图像的编码数据重新解码,从而保证图像中的文字能够清楚的显示。与现有技术相比,对网页中的图像在降低采样解码后,识别出以文字为主的图像,并对识别出的图像重新解码,既能够减少图像所占用的系统资源,又能够保证图像中的文字清楚的显示。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明实施例的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。
图1为本发明实施例提供的图像解码方法的第一种实施方式的方法流程图;
图2为本发明实施例提供的图像解码方法的第二种实施方式的方法流程图;
图3为本发明实施例提供的图像解码装置的第一种实施方式的结构示意图;
图4为本发明实施例提供的图像解码装置的第二种实施方式的结构示意图。
具体实施方式
通常,对图像降低采样即减少图像的像素,因此,会降低图像的清晰度。一些彩色图像,例如风景、人像等,即使图像清晰度降低,也不会影响用户对图像的识别;然而对于以文字为主的图像,降低采样会造成图像中的文字难以识别。而以文字为主的图像一般为灰度图像,本发明提供的技术方案,从降低采样后的图像中识别出灰度图像,然后对识别出的灰度图像按照原始大小重新解码,以使图像中的文字能够被清楚识别。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,该图示出了本发明实施例提供的图像解码方法的第一种实施方式的方法流程图,所述方法包括:
步骤S101:获取图像的编码数据。
其中,图像的编码数据作为网页资源数据的一部分,存储在终端设备的内存中。在图像显示之前,需要将编码数据读取出,并对编码数据进行解码,得到图像的像素数据,终端设备根据像素数据将图像进行显示。其中,编码数据可以为表达像素数据关系的函数,也可以为其他图像编码数据,本发明此处不再赘述。
步骤S102:对编码数据进行解码,得到图像的像素数据。
在本步骤中,按照第一解码规则对编码数据进行解码,得到图像的像素数据,其中,第一解码规则在本发明技术方案中可以指降低采样的方式。为了保证网页中图像所占用的系统资源不会过大,在解码前,为每张图像预先划分一定大小的存储区域,在对编码数据解码时,如果图像的原比例像素数据所占的存储区域大于预先划分的存储区域,则将编码数据降低采样解码,保证解码后的像素数据所占的存储区域,小于或者等于预先划分的存储区域大小;如果图像的原比例像素数据小于或者等于预先划分的存储区域大小,则按照原比例对编码数据进行解码。因此,当网页中包含多个图像时,每张图像解码时的采样率根据图像的大小及预先划分的存储区域的大小确定,且解码时的采样率各不相同。
例如,在本发明的一个优选示例中,网页中包含的两张图像,预先划分的存储区域能够存储的图像的最大像素为600*600。其中一张图像的像素为500*500,图像的原比例像素数据小于预先划分的存储区域的面积,因此,对该图像的编码数据按照原比例大小解码即可;另一张图像的像素为1024*1024像素,很明显,该图像的原比例像素数据大于预先划分的存储区域的面积,因此,在对该图像的编码数据进行解码时,可以采用降低采样的方式将原图像中每两个像素合并为一个像素存储,最终将该图像解码为512*512像素的无压缩的位图。采用降低采样的方式对图像进行解码为本领域技术人员所熟知的技术,本发明此处不再赘述。
此外,需要指出的,由于产生本发明技术问题的原因是对图像的编码数据采用降低采样的方式解码,因此,本发明技术方案针对的是需要进行降低采样处理的图像,即本发明描述中所指的图像,均默认为进行降低采样处理的图像,本发明此处特此说明,并在后续描述中不再赘述。
步骤S103:根据像素数据识别图像中的灰阶像素。
本步骤中,为了确定图像是否为灰度图像,可以通过扫描图像中全部像素的方式,识别图像中的灰阶像素,根据图像中灰阶像素的数量确定该图像是否为灰度图像。当然,本实施例中,可以对图像中的全部像素进行识别,但是,这种方式工作量较大,识别消耗的时间过长。因此,在本发明的另一个优选示例中,可以预先确定扫描密度,按照该扫描密度扫描图像的像素。例如,扫描密度为n,在扫描像素时,每隔n个像素读取一个像素,即,只读取第1个像素,第n+1个像素,第2*n+1个像素,第3*n+1个像素,并判断所读取的像素是否为灰阶像素。由此可见,这种方式既能够缩短扫描的耗时,减少工作量,还能够判断出该图像是否为灰度图像。当然,扫描密度n可以根据不同的图像进行不同的设置,本发明此处不再赘述。
需要说明的,读取像素之后,可以从该像素的像素数据中获取该像素的R分量值、G分量值及B分量值,当R分量值、G分量值及B分量值两两的差值均在一定范围内时,认为该像素为灰阶像素;否则,认为该像素为彩色像素。
步骤S104:对编码数据重新解码。
在上述步骤的基础上,当所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对编码数据重新解码。在本发明技术方案中,如果灰阶像素的数量占图像中像素总数量达到预设比值时,认为该图像为灰度图像,然后可以对该图像的编码数据按照原比例重新解码,以使该图像显示时的清晰度更高。同样的,在本实施例中,可以根据预设比值计算得到灰阶像素的预设阈值,当灰阶像素的总数量值大于等于该预设阈值时,对编码数据重新解码。
本步骤中,如果对图像中的全部像素进行扫描,假设扫描到的灰阶像素数量为N,图像的高为W个像素,宽为H个像素,其总像素数量为W*H,预设比值为P,如果是对图像中的全部像素进行扫描,当N/(W*H)的结果大于或者等于P时,将图像确定为灰度图像;如果扫描密度为n,当(N*n)/(W*H)的结果大于或者等于P时,将图像确定为灰度图像。
本步骤中,将识别出的灰度图像,按照原比例对编码数据重新解码,能够提高图像显示时的清晰度,从而使图像中的文字更加容易被识别。
通过本实施例的描述,本发明所提供的图像解码方法,在获取到图像的编码数据之后,按照第一解码规则解码得到图像的像素数据,从而减少图像所占用的系统资源;然后通过图像的像素数据识别图像中的灰阶像素,如果灰阶像素的总数量值大于或者等于预设阈值时,则认为该图像以文字为主,对该图像的编码数据重新解码,从而保证图像中的文字能够清楚的显示。与现有技术相比,对网页中的图像在降低采样解码后,识别出以文字为主的图像,并对识别出的图像重新解码,既能够减少图像所占用的系统资源,又能够保证图像中的文字清楚的显示。
为了使本发明的技术方案更加优化,还请参见图2,图2示出了本发明实施例提供的图像解码方法的第二种实施方式的方法流程图。该实施例为上述实施例的扩充,关于本实施例方法步骤中与上述实施例重复的部分可参见上述实施例的内容,在本实施例中不再赘述。本实施例中,所述方法包括以下步骤:
步骤S201:获取图像的编码数据。
步骤S202:对编码数据进行解码,得到图像的像素数据。
步骤S203:读取目标像素。
在上述实施例的基础上,为了提高识别效率,根据灰阶像素的预设比例计算得到彩色像素应当占的比例,进一步得到彩色像素的临界数量值。由于彩色像素的临界数量值远小于灰阶像素的预设阈值,因此,在灰阶像素的总数量值达到预设阈值之前,如果彩色像素的数量值超过临界阈值时,将图像确认为彩色图像,本发明的技术方案无须对彩色图像重新解码,所以,至此,完成对该图像的解码操作,从而减少了所识别的像素数量,提高了识别效率。
需要指出的,为了避免图像开始部分的像素全部为灰阶像素或者彩色像素,导致识别结果不准确的情况,可以根据所读取的像素的位置数据,确定图像对角线上的像素,在识别时,将图像对角线上的像素作为目标像素进行读取,从而能够提高识别的准确性。当然,提高识别准确性的方式还可以为其他方式,本发明对此不做限制。
步骤S204:根据像素数据确定所述目标像素的性质。
在上述实施例的基础上,本步骤中根据像素数据确定所述目标像素的性质,具体包括:获取所述目标像素的R分量值、G分量值和B分量值;计算R分量值、G分量值和B分量值两两之间的差,得到三个差值;计算三个差值的绝对值之和,当三个差值的绝对值之和小于或者等于预设容差时,将该像素确定为灰阶像素;否则,将该像素确定为彩色像素。通常,灰阶像素的R分量值、G分量值和B分量值相等,但是在解码过程中,受到终端设备及解码过程的影响,R分量值、G分量值和B分量值可能会产生微小的变化,因此,通过计算三个分量差值的绝对值之和能够识别出灰阶像素。
然而,将图像的编码数据进行解码可能得到32位或者16位的二进制位图,而32位的位图R、G、B三个分量值分别为8个比特位,16位的位图R、G、B三个分量值分别4个比特位或者分别占5、6、5个比特位。需要说明的,二进制比特位数量中4个比特位的取值范围是2的4次方,即0-15(包含0和15),同理8个比特位的取值范围是2的8次方,即0-255(包含0和255)。为了使判断更加精确,可以根据分量值的比特位数量设置预设容差,例如,当图像为32位位图时,R、G、B三个分量值均为8个比特位,其取值范围均为0-255,预设容差可以设置为8;当图像为16位位图时,R、G、B三个分量值均为4个比特位,其取值范围均为0-15(包含0和15),预设容差可以设置为4,当然,也可以设置为其他合适的值,本发明对此不做限制。
当然,上述限制仅为R分量值、G分量值和B分量值的比特位数量相同的条件下,对R分量值、G分量值和B分量值的计算。当R分量值、G分量值和B分量值分别占5、6、5个比特位时,由于R分量值和B分量值的取值范围是0-31(包含0和31),G分量值的取值范围为0-63(包含0和63),因此,三个分量值之间没有可比性,因此,需要将三个分量值换算为相等的取值范围之后,再根据换算后的取值进行计算。此处可以将G分量值的取值范围换算为0-31(包含0和31),取预设容差为4;或者将R分量值和B分量值的取值范围换算为0-63(包含0和63),取预设容差为8。具体的换算过程为本领域技术人员所熟知的技术,本发明此处不再赘述。
步骤S205:将灰阶像素的数量值加一。
在对目标像素识别时,当目标像素为灰阶像素时,灰阶像素的数量加一;当目标像素为彩色像素时,彩色像素的数量加一。本步骤中,在识别的过程中,同时计算灰阶像素及彩色像素的数量,能够简化后续操作步骤,提高解码效率。
步骤S206:判断灰阶像素的数量值是否等于预设阈值,若是,执行步骤S207;若否,执行步骤S203。
在上述描述的基础上可知,当灰阶像素的数量值至少等于预设阈值时,才能够将图像确定为灰度图像,因此,在彩色像素的数量值大于其临界值之前,每识别出一个灰阶像素,灰阶像素的数量值加一,当灰阶像素的数量值小于预设阈值时,读取下一个目标像素继续识别。
步骤S207:将所述数量值确定为总数量值。
由于灰阶像素或者彩色像素的数量值达到一定值时,就能够确定图像是否为灰度图像,因此,在识别的过程中,只要确定了任何一种像素的数量值达到其对应的预设阀值,即可结束识别。例如,一张降低采样解码后的图像包括500个像素,扫描密度为5,灰阶像素的预设比例为95%,根据(W*H*P)/n计算得到灰阶像素的预设阈值,即(500*95%)/5得到灰阶像素的预设阈值为95,根据(W*H*(1-P))/n彩色像素的临界阈值为5。从图像第一个像素开始,每隔5个像素读取一个目标像素,当读取到第M(6≤M≤100)个目标像素,如果已经确定的彩色像素的数量值等于6时,即可停止读取,将图像确定为彩色图像,至此已完成对该图像的解码操作;当读取到第H(95≤H≤100)个目标像素,如果已经确定的灰阶像素数量值等于95时,即可停止读取,将图像确定为灰度图像,并对该图像按照原比例重新解码。需要说明的,由于需要读取的目标像素总数为100个,灰阶像素的预设阈值为95,彩色像素的临界阈值为5,所以如果在读取过程中,已经确定的彩色像素的数量值大于5时,即可得知灰阶像素的数量值小于95,因此,此时即可停止读取,将图像确定为彩色图像;同理,若在读取过程中,已经确定的灰阶像素的数量值等于95时,即可得知彩色像素的数量值不大于5,因此,无须继续读取目标像素就能够将图像确定为灰阶像素。
本实施例中,在读取完全部的目标像素之前,如果根据已经确定的像素能够确定图像性质时,即可停止读取目标像素,从而能够减少部分计算过程,因此能够大大的提高图像的识别效率。
步骤S208:按照第二解码规则对编码数据重新解码。
本实施例中,在像素识别的过程中,将图像对角线上的像素作为目标像素,能够提高识别的准确性;分别统计已经识别的灰阶像素的数量及彩色像素的数量,当其中任一像素的数量达到其对应的阈值后,即可确定图像的性质,停止对像素的识别,进一步提高了识别的效率。
与上述实现方法相对应的,本发明实施例还提供了图像解码装置,如图3所示,为本发明实施例提供的图像解码装置的第一种实施方式的结构示意图。所述装置包括:获取单元11、第一解码单元12、识别单元13及第二解码单元14,其中,所述获取单元11:用于获取图像的编码数据;所述第一解码单元12,用于按照第一解码规则对获取单元11获取的编码数据进行解码,得到所述图像的像素数据;所述识别单元13:用于根据所述第一解码单元12解码得到的像素数据识别图像中的灰阶像素;所述第二解码单元14,用于当所述识别单元13所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对所述编码数据重新解码。
所述装置中各个单元的功能和作用的实现过程详见上述方法中对应的实现过程,在此不再赘述。
本发明实施例所提供的图像解码装置,在获取到图像的编码数据之后,按照第一解码规则解码得到图像的像素数据,从而减少图像所占用的系统资源;然后通过图像的像素数据识别图像中的灰阶像素,如果灰阶像素的总数量值大于或者等于预设阈值时,则认为该图像以文字为主,对该图像的编码数据重新解码,从而保证图像中的文字能够清楚的显示。与现有技术相比,对网页中的图像在降低采样解码后,识别出以文字为主的图像,并对识别出的图像重新解码,既能够减少图像所占用的系统资源,又能够保证图像中的文字清楚的显示。
还请参见图4,图4为本发明实施例提供的图像解码装置的第二种实施方式的结构示意图,所述装置包括:获取单元21、第一解码单元22、读取子单元23、第一确定子单元24、执行子单元25、第一判断子单元26、第二确定子单元27及第二解码单元28,其中,所述获取单元21、第一解码单元22及所述第二解码单元28的功能及作用与上述实施例相似,本发明此处不再赘述。所述读取子单元23,用于读取目标像素;所述第一确定子单元24:用于根据像素数据确定所述目标像素的性质;所述执行子单元25,用于当第一确定子单元24确定所述目标像素为灰阶像素时,执行将灰阶像素的数量值加一的操作;所述第一判断子单元26,用于判断灰阶像素的数量值是否等于预设阈值;所述第二确定子单元27:用于当灰阶像素的数量值等于预设阈值时,将所述数量值确定为总数量值。在本实施例中,所述读取子单元23,还用于当灰阶像素的数量值小于预设阈值时,按照预设规则读取下一个目标像素。
在本实施例中,识别单元还包括第二判断子单元,所述第二判断子单元用于判断彩色像素的数量值是否大于彩色像素的临界阈值;当彩色像素的数量值小于或者等于临界阈值时,所述第一判断子单元26,还用于当彩色像素的数量值小于或者等于临界阈值时,判断灰阶像素的数量值是否等于预设阈值。
其中,所述第一确定子单元24还包括:获取模块、计算模块及确定模块,其中,所述获取模块,用于获取所述目标像素的R分量值、G分量值和B分量值;所述计算模块:计算R分量值、G分量值和B分量值两两之间的差,得到三个差值;所述确定模块:用于当三个差值的绝对值之和不大于预设容差时,将目标像素确定为灰阶像素。
在本实施例的基础上,在另一个实施例中,所述计算模块包括:获取子模块、判断子模块及转换子模块,其中,所述获取子模块:用于获取R分量值、G分量值与B分量值的比特位数量;所述判断子模块:判断R分量值、G分量值与B分量值的比特位数量是否相等;所述计算模块,还用于当R分量值、G分量值与B分量值的比特位数量相等时,计算R分量值、G分量值和B分量值两两之间的差;所述转换子模块:用于当R分量值、G分量值与B分量值的比特位数量不相等时,将R分量值、G分量值与B分量值转换为相同的比特位数量;所述计算模块,还用于按照转换后的分量值执行计算R分量值、G分量值和B分量值两两之间的差。
所述装置中各个单元的功能和作用的实现过程详见上述方法中对应的实现过程,在此不再赘述。
综合上述,本发明实施例所提供的图像解码方法及装置,在获取到图像的编码数据之后,按照第一解码规则解码得到图像的像素数据,从而减少图像所占用的系统资源;然后通过图像的像素数据识别图像中的灰阶像素,如果灰阶像素的总数量值大于或者等于预设阈值时,则认为该图像以文字为主,对该图像的编码数据重新解码,从而保证图像中的文字能够清楚的显示。与现有技术相比,对网页中的图像在降低采样解码后,识别出以文字为主的图像,并对识别出的图像重新解码,既能够减少图像所占用的系统资源,又能够保证图像中的文字清楚的显示。
可以理解的是,本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种图像解码方法,其特征在于,所述方法包括:
获取图像的编码数据;
按照第一解码规则对所述编码数据进行解码,得到所述图像的像素数据;
根据像素数据识别图像中的灰阶像素;
当所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对所述编码数据重新解码。
2.如权利要求1所述的方法,其特征在于,所述根据像素数据识别图像中的灰阶像素,包括:
读取目标像素;
根据像素数据确定所述目标像素的性质;
当所述目标像素为灰阶像素时,执行将灰阶像素的数量值加一的操作;
判断灰阶像素的数量值是否等于预设阈值;
如果灰阶像素的数量值等于预设阈值,将所述数量值确定为总数量值;
如果灰阶像素的数量值小于预设阈值,按照预设规则读取下一个目标像素。
3.如权利要求2所述的方法,其特征在于,当根据素数据确定目标像素不是灰阶像素时,则认为所述目标像素为彩色像素,执行将彩色像素的数量值加一的操作;
判断灰阶像素的数量是否等于预设阈值之前,所述方法还包括:
判断彩色像素的数量值是否大于彩色像素的临界阈值;
如果彩色像素的数量值大于所述临界阈值,结束操作;
如果彩色像素的数量值小于或者等于所述临界阈值,执行判断灰阶像素的数量值是否等于预设阈值的步骤。
4.如权利要求2所述的方法,其特征在于,根据像素数据确定所述目标像素的性质包括:
获取所述目标像素的R分量值、G分量值和B分量值;
计算R分量值、G分量值和B分量值两两之间的差,得到三个差值;
当三个差值的绝对值之和不大于预设容差时,将目标像素确定为灰阶像素。
5.如权利要求4所述的方法,其特征在于,所述计算R分量值、G分量值和B分量值两两之间的差,得到三个差值,包括:
获取R分量值、G分量值与B分量值的比特位数量;
判断R分量值、G分量值与B分量值的比特位数量是否相等;
如果R分量值、G分量值与B分量值的比特位数量相等,执行计算R分量值、G分量值和B分量值两两之间的差,得到三个差值的步骤;
如果R分量值、G分量值与B分量值的比特位数量不相等,将R分量值、G分量值与B分量值转换为相同的比特位数量,并按照转换后的分量值执行计算R分量值、G分量值和B分量值两两之间的差,得到三个差值的步骤。
6.图像解码装置,其特征在于,所述装置包括:
获取单元:用于获取图像的编码数据;
第一解码单元:用于按照第一解码规则对所述获取单元获取的编码数据进行解码,得到所述图像的像素数据;
识别单元:用于根据所述第一解码单元解码得到的像素数据识别图像中的灰阶像素;
第二解码单元:用于当所述识别单元所识别的灰阶像素的总数量值大于或者等于预设阈值时,按照第二解码规则对所述编码数据重新解码。
7.如权利要求6所述的装置,其特征在于,所述识别单元包括:读取子单元、第一确定子单元、执行子单元、第一判断子单元及第二确定子单元,其中,
所述读取子单元,用于读取目标像素;
所述第一确定子单元:用于根据像素数据确定所述目标像素的性质;
所述执行子单元,用于当第一确定子单元确定所述目标像素为灰阶像素时,执行将灰阶像素的数量值加一的操作;
所述第一判断子单元,用于判断灰阶像素的数量值是否等于预设阈值;
所述第二确定子单元:用于当灰阶像素的数量值等于预设阈值时,将所述数量值确定为总数量值;
所述读取子单元,还用于当灰阶像素的数量值小于预设阈值时,按照预设规则读取下一个目标像素。
8.如权利要求7所述的装置,其特征在于,所述识别单元还包括:
第二判断子单元,用于判断彩色像素的数量值是否大于彩色像素的临界阈值;
所述第一判断子单元:还用于当彩色像素的数量值小于或者等于临界阈值时,判断灰阶像素的数量值是否等于预设阈值。
9.如权利要求7所述的装置,其特征在于,所述第一确定子单元还包括:获取模块、计算模块及确定模块,其中,
所述获取模块,用于获取所述目标像素的R分量值、G分量值和B分量值;
所述计算模块:计算R分量值、G分量值和B分量值两两之间的差,得到三个差值;
所述确定模块:用于当三个差值的绝对值之和不大于预设容差时,将目标像素确定为灰阶像素。
10.如权利要求9所述的装置,其特征在于,所述计算模块包括:获取子模块、判断子模块及转换子模块,其中,
所述获取子模块:用于获取R分量值、G分量值与B分量值的比特位数量;
所述判断子模块:判断R分量值、G分量值与B分量值的比特位数量是否相等;
所述计算模块,还用于当R分量值、G分量值与B分量值的比特位数量相等时,计算R分量值、G分量值和B分量值两两之间的差;
所述转换子模块:用于当R分量值、G分量值与B分量值的比特位数量不相等时,将R分量值、G分量值与B分量值转换为相同的比特位数量;所述计算模块,还用于按照转换后的分量值执行计算R分量值、G分量值和B分量值两两之间的差。
CN201410293058.XA 2014-06-25 2014-06-25 图像解码方法及装置 Active CN105338360B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410293058.XA CN105338360B (zh) 2014-06-25 2014-06-25 图像解码方法及装置
PCT/CN2014/091926 WO2015196717A1 (zh) 2014-06-25 2014-11-21 图像解码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410293058.XA CN105338360B (zh) 2014-06-25 2014-06-25 图像解码方法及装置

Publications (2)

Publication Number Publication Date
CN105338360A true CN105338360A (zh) 2016-02-17
CN105338360B CN105338360B (zh) 2019-02-15

Family

ID=54936643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410293058.XA Active CN105338360B (zh) 2014-06-25 2014-06-25 图像解码方法及装置

Country Status (2)

Country Link
CN (1) CN105338360B (zh)
WO (1) WO2015196717A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548140A (zh) * 2022-04-26 2022-05-27 成都普什信息自动化有限公司 二维码解码方法、数据关联方法、关联装置及使用方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859053B (zh) * 2018-11-08 2023-08-29 平安科技(深圳)有限公司 图像查重的方法、装置、计算机设备及存储介质
CN112040236B (zh) * 2020-09-04 2022-02-18 维沃移动通信有限公司 图像处理方法、处理装置、以及图像显示方法、显示装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1209929A (zh) * 1996-10-01 1999-03-03 菲利浦电子有限公司 卸载具有加速文本字符和线条艺术形式的图象图形
CN1933542A (zh) * 2005-09-15 2007-03-21 株式会社东芝 图像数据解码装置和方法
CN101106709A (zh) * 2006-07-10 2008-01-16 逐点半导体(上海)有限公司 图像压缩方法
CN101399991A (zh) * 2007-09-26 2009-04-01 华为技术有限公司 一种视频解码的方法和装置
US20100067023A1 (en) * 2008-09-18 2010-03-18 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program
CN103700121A (zh) * 2013-12-30 2014-04-02 Tcl集团股份有限公司 一种复合图像的压缩方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1282149C (zh) * 2002-08-22 2006-10-25 联想(北京)有限公司 一种在低分辨率显示设备中控制浏览器显示网页的方法
CN100452039C (zh) * 2005-11-18 2009-01-14 财团法人资讯工业策进会 网页数据显示的转换方法以及系统
CN101984426B (zh) * 2010-10-21 2013-04-10 优视科技有限公司 用于对网页图片进行字符切分的方法及装置
CN103092989A (zh) * 2013-02-08 2013-05-08 广州市渡明信息技术有限公司 适应终端屏幕的图片显示方法及设备
CN103678526A (zh) * 2013-11-29 2014-03-26 贝壳网际(北京)安全技术有限公司 浏览器解码图片的方法、装置和客户端

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1209929A (zh) * 1996-10-01 1999-03-03 菲利浦电子有限公司 卸载具有加速文本字符和线条艺术形式的图象图形
CN1933542A (zh) * 2005-09-15 2007-03-21 株式会社东芝 图像数据解码装置和方法
CN101106709A (zh) * 2006-07-10 2008-01-16 逐点半导体(上海)有限公司 图像压缩方法
CN101399991A (zh) * 2007-09-26 2009-04-01 华为技术有限公司 一种视频解码的方法和装置
US20100067023A1 (en) * 2008-09-18 2010-03-18 Canon Kabushiki Kaisha Image processing apparatus, image processing method and program
CN103700121A (zh) * 2013-12-30 2014-04-02 Tcl集团股份有限公司 一种复合图像的压缩方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114548140A (zh) * 2022-04-26 2022-05-27 成都普什信息自动化有限公司 二维码解码方法、数据关联方法、关联装置及使用方法
CN114548140B (zh) * 2022-04-26 2022-08-12 成都普什信息自动化有限公司 二维码解码方法、数据关联方法、关联装置及使用方法

Also Published As

Publication number Publication date
CN105338360B (zh) 2019-02-15
WO2015196717A1 (zh) 2015-12-30

Similar Documents

Publication Publication Date Title
CN109146892B (zh) 一种基于美学的图像裁剪方法及装置
US9697423B1 (en) Identifying the lines of a table
CN102246165B (zh) 利用压缩梯度直方图来代表和标识特征描述符的方法和装置
CN108985066B (zh) 一种智能合约安全漏洞检测方法、装置、终端及存储介质
CN113343958B (zh) 一种文本识别方法、装置、设备及介质
CN101526963A (zh) 网页编码识别方法、装置和终端设备
US20200043126A1 (en) Methods and systems for processing graphics
CN114429637B (zh) 一种文档分类方法、装置、设备及存储介质
CN105338360A (zh) 图像解码方法及装置
CN114626967A (zh) 一种数字水印嵌入与提取方法、装置、设备及存储介质
CN115984856A (zh) 文档图像矫正模型的训练方法、文档图像的矫正方法
CN115311469A (zh) 图像标注方法、训练方法、图像处理方法以及电子设备
CN104156251A (zh) 一种图片处理方法及其设备
CN114429640A (zh) 图纸分割方法、装置及电子设备
JP2013080448A (ja) 二次元コードを出力する計算機及び当該計算機に実行されるプログラム
CN111709338B (zh) 一种用于表格检测的方法、装置及检测模型的训练方法
CN114881227B (zh) 模型压缩方法、图像处理方法、装置和电子设备
CN104182928A (zh) 矢量图形快速多边形填充方法
CN116912556A (zh) 图片分类方法、装置、电子设备及存储介质
CN116665215A (zh) 图像显著性区域提取方法、装置、计算机设备及存储介质
CN106534874B (zh) 纹理砖压缩及解压缩方法以及使用该方法的装置
CN114359490A (zh) 基于多模态融合的电磁地图构建方法及相关装置
CN107809643B (zh) 一种图像的解码方法、装置及介质
CN116304029B (zh) 一种使用知识异构的深度学习模型蒸馏方法和系统
CN113434943B (zh) Bim标准编码的处理方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200527

Address after: 310051 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Patentee after: Alibaba (China) Co.,Ltd.

Address before: 100080, No. 28, Fu Cheng Road, 12, Beijing, Haidian District

Patentee before: UC MOBILE Ltd.