CN109447086A - 一种图片文字颜色的提取方法及装置 - Google Patents

一种图片文字颜色的提取方法及装置 Download PDF

Info

Publication number
CN109447086A
CN109447086A CN201811095558.7A CN201811095558A CN109447086A CN 109447086 A CN109447086 A CN 109447086A CN 201811095558 A CN201811095558 A CN 201811095558A CN 109447086 A CN109447086 A CN 109447086A
Authority
CN
China
Prior art keywords
pixel
described image
color value
picture
character area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811095558.7A
Other languages
English (en)
Inventor
贺三元
张桀宁
黄建锋
罗晗璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN201811095558.7A priority Critical patent/CN109447086A/zh
Publication of CN109447086A publication Critical patent/CN109447086A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图片文字颜色的提取方法及装置,涉及图片处理技术领域,可以准确还原图片中文字的颜色信息。所述方法包括:获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息;根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色;计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。

Description

一种图片文字颜色的提取方法及装置
技术领域
本发明涉及图片处理技术领域,特别是涉及一种图片文字颜色的提取方法及装置。
背景技术
在每一个软件应用中,用户界面(UI)都是必不可少一部分,是终端与用户发生交互和情感的场景。创建用户界面最基本的组件就是视图,通过多个层级的视图的布局,生成软件应用所需显示的多个界面。
图片视图作为创建用户界面的基本组件,用于在屏幕中显示任何可绘制对象。现有技术在创建用户界面的过程中,通常会将图片中文字的颜色转换成描述标识的形式,进而根据描述标识将获取到的图片直接生成图片视图,并采用机器来自动还原图片视图中文字的颜色。
然而,上述图片中文字的颜色信息通常为开发者预先根据图片的真实颜色所设置的,在设置过程中会加入开发者的个人主观因素,使得不同图片中相同颜色在显示过程中存在差异,从而机器在自动还原图片中文字的颜色信息的过程中,并不能准确还原图片中文字的颜色。
发明内容
有鉴于此,本发明提供了一种图片文字颜色的提取方法及装置,主要目的在于解决如何准确还原图片中文字的颜色信息的问题。
依据本发明一个方面,提供了一种图片文字颜色的提取方法,该方法包括:
获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息;
根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色;
计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。
进一步地,所述计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色包括:
遍历所述图像矩阵中的像素,获取像素在各个颜色通道的颜色值;
根据所述像素在各个颜色通道的颜色值以及所述文字区域的背景色在各个颜色通道的颜色值,计算所述图像矩阵中像素在颜色上与所述文字区域的背景色之间的差异度;
从所述差异度排名前N的像素中选择分布最多的像素颜色值作为文字区域的前景色。
进一步地,所述从所述差异度排名在预设数值之前的像素中选择分布最多的像素颜色值作为所述文字区域的前景色包括:
统计所述差异度排名在预设数值之前的像素颜色值以及相同颜色值的像素数量,得到所述差异度排名在预设数值之前的像素颜色值的分布情况;
从所述差异度排名在预设数值之前的像素中选择相同颜色值的像素数量最多的颜色值作为所述文字区域的前景色。
进一步地,所述根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色包括:
根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况;
提取在所述图像矩阵中相同颜色值的像素数量最多的颜色值作为所述文字区域的背景色。
进一步地,所述根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况包括:
根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息;
统计距离所述图像矩阵各个顶点预设范围内每个像素颜色以及相同颜色值的像素数量,得到所述图像矩阵对应像素颜色值的分布情况。
进一步地,在所述根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息之后,所述方法还包括:
若距离所述图像矩阵各个顶点预设范围内存在超出图片范围的像素,则将所述超出图片范围的像素删除。
进一步地,所述获取图片中的文字区域包括:
通过光学字符识别技术定位图片中的文字;
利用文字宽度与间隙规则将图像中的文字划分为多个文字区域,得到图片中多个文字区域。
依据本发明另一个方面,提供了一种图片文字颜色的提取装置,该装置包括:
获取单元,用于获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息;
第一提取单元,用于根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色;
第二提取单元,用于计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。
进一步地,所述第二提取单元包括:
获取模块,用于遍历所述图像矩阵中的像素,获取像素在各个颜色通道的颜色值;
计算模块,用于根据所述像素在各个颜色通道的颜色值以及所述文字区域的背景色在各个颜色通道的颜色值,计算所述图像矩阵中像素在颜色上与所述文字区域的背景色之间的差异度;
选择模块,用于从所述差异度排名在预设数值之前的像素中选择分布最多的像素颜色值作为所述文字区域的前景色。
进一步地,所述选择模块,具体用于统计所述差异度排名在预设数值之前的像素颜色值以及相同颜色值的像素数量,得到所述差异度排名在预设数值之前的像素颜色值的分布情况;
所述选择模块,具体还用于从所述差异度排名在预设数值之前的像素中选择相同颜色值的像素数量最多的颜色值作为所述文字区域的前景色。
进一步地,所述第一提取单元包括:
统计模块,用于根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况;
提取模块,用于提取在所述图像矩阵中相同颜色值的像素数量最多的颜色值作为所述文字区域的背景色。
进一步地,所述统计模块,具体用于根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息;
所述统计模块,具体还用于统计距离所述图像矩阵各个顶点预设范围内每个像素颜色以及相同颜色值的像素数量,得到所述图像矩阵对应像素颜色值的分布情况。
进一步地,所述第一提取单元还包括:
删除模块,用于在所述根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息之后,若距离所述图像矩阵各个顶点预设范围内存在超出图片范围的像素,则将所述超出图片范围的像素删除。
进一步地,所述获取单元包括:
定位模块,用于通过光学字符识别技术定位图片中的文字;
划分模块,用于利用文字宽度与间隙规则将图像中的文字划分为多个文字区域,得到图片中多个文字区域。
依据本发明又一个方面,提供了一种存储设备,其上存储有计算机程序,所述程序被处理器执行时实现上述图片文字颜色的提取方法。
依据本发明再一个方面,提供了一种图片文字颜色的提取装置,包括存储设备、处理器及存储在存储设备上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图片文字颜色的提取方法。
借由上述技术方案,本发明提供的一种图片文字颜色的提取方法、装置及计算机存储介质,与目前通过开发者预先根据图片的真实颜色设置图片中文字的颜色信息的方式相比,本发明能够直接应用在图片中的文字区域上,并将文字区域映射为图像矩阵,通过统计在图像矩阵预设范围内像素颜色值的分布情况,该分布情况能够体现文字区域背景在各个颜色上的比重,提取在图像矩阵中分布最多的像素颜色值作为文字区域的背景色,从而准确提取图片文字的背景色,通过计算图像矩阵中像素颜色值与文字区域的前景色之间的差异度,该差异度能够反映文字区域内的文字颜色,差异度越大像素的颜色值可能为文字颜色的几率越大,提取差异度符合预设条件的像素颜色值作为文字区域的前景色,从而准确提取图片文字的前景色,这里使用的图片文字颜色提取方式无需开发者设置图片文字颜色,能够自动提取图片中文字颜色,并准确还原图片中文字的真实颜色。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种图片文字颜色的提取方法流程示意图;
图2示出了本发明实施例提供的另一种图片文字颜色的提取方法流程示意图;
图3示出了本发明实施例提供的一种图片文字颜色的提取装置的结构示意图;
图4示出了本发明实施例提供的另一种图片文字颜色的提取的装置结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种图片文字颜色的提取方法,可以实现准确还原图片中文字的颜色信息的目的,如图1所示,该方法包括:
101、获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息。
在开发过程中,经常遇到一些图片展示需求,这里的图片可以为通过界面向用户展示的图片,可以为淘宝图片、登录图片等,在创建用户界面过程中,如果用户界面中需要图片的展示,会预先创建图片视图,并将图片视图以记录的形式存储在数据库中,通过渲染图片视图在用户界面中显示相应图片。
其中,图片中的文字区域可以为一行文字、一段文字或者多段文字等,这里每个文字区域中都会包括若干文字,而对于没有检测出文字的区域,则不作考虑或删除。具体可以通过文字识别软件检测图片中的文字,并通过手动或者机器框选出文字对应区域的轮廓,筛选出多个文字区域并返回文字区域在图片中各自对应的位置信息。
需要说明的是,这里每个文字区域相当于图片的一部分,是一个标准的矩形,有着图片的宽度和高度,所以多个文字区域组合的宽度和高度大小必然不会超过图片宽度和高度的大小,而矩阵有着行和列,为了方便对图片的处理,将每个文字区域映射为一个图像矩阵,图像矩阵由多个像素组成,每个像素对应一个坐标位置,通过对矩阵中像素的操作来实现对图片的操作。
通常情况下,文字区域和图片中其他区域的颜色有所不同,如果在生成图片视图过程中不考虑文字颜色,那么得到的图片视图只会黑白颜色,从而在用户界面中展示图片中的文字并非真实颜色,本发明实施例将图片中每个文字区域映射为图像矩阵,通过图像矩阵中各个像素的颜色来提取图片文字区域的颜色,从而保证文字颜色提取的准确性。
102、根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色。
由于每个图像矩阵在图片中对应有各自的位置信息,该位置信息通常以图像矩阵左上角像素的坐标、图像矩阵的宽度和图像矩阵的长度的形式进行存储,通过图像矩阵左上角像素的坐标、图像矩阵的宽度和图像矩阵的长度可以知道图像矩阵中任一像素的坐标。
对于本发明实施例,图像矩阵的预设范围可以为图像矩阵边缘像素的预设距离内,也可以为图像矩阵各个顶点像素的预设距离内,这里对像素的预设距离不进行限定,可以为以像素为中心取3*3矩阵,使得周围像素与中心像素的距离为1,也可以为以像素为中心取3*3矩阵,使得周围像素与中心像素的距离为2,进一步遍历各个矩阵中每个像素,获取每个像素颜色值,并统计图像矩阵预设范围内像素颜色值的分布情况,由于每个图像矩阵预设范围内具有多个像素,可能会存在颜色值相同的多个像素,这些颜色值相同的像素对应的颜色也就是在图像矩阵中分布最多的像素颜色值,同理对于其他图像矩阵,重复上述统计图像矩阵预设范围内像素颜色值的分布情况,提取在每个图像矩阵中分布最多的像素颜色值作为文字区域的背景色。
需要说明的是,对于在每个图像矩阵中分布最多的像素颜色值,说明该颜色在文字区域边缘的出现频率最高,将出现频率最高的颜色作为文字区域的背景色,使得提取到文字区域的背景色具有更高的准确性。
103、计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。
对于本发明实施例,计算图像矩阵中像素颜色值与文字区域的背景色之间的差异度,具体可以通过分别计算图像矩阵中每个像素在各个颜色通道上的颜色值以及文字区域的背景色在各个颜色通道上的颜色值,这里每个像素在各个颜色通道上的颜色值是变化的,而文字区域的背景色在各个通道上的颜色值是固定,并根据每个像素以及文字区域的背景色在对应颜色通道上的颜色值,计算图像矩阵中每个像素颜色值与文字区域的背景色之间的差异度,提取差异度符合预设条件的像素颜色值作为文字区域的前景色。
其中,预设条件可以为符合差异度排名条件,还可以为符合差异度排名条件的同时附加颜色分布条件,当然还可以附加其他颜色分量条件,如颜色饱和度条件、颜色亮度条件等。
本发明实施例提供的图片文字颜色的提取方法,与目前通过开发者预先根据图片的真实颜色设置图片中文字的颜色信息的方式相比,本发明能够直接应用在图片中的文字区域上,并将文字区域映射为图像矩阵,通过统计在图像矩阵预设范围内像素颜色值的分布情况,该分布情况能够体现文字区域背景在各个颜色上的比重,提取在图像矩阵中分布最多的像素颜色值作为文字区域的背景色,从而准确提取图片文字的背景色,通过计算图像矩阵中像素颜色值与文字区域的前景色之间的差异度,该差异度能够反映文字区域内的文字颜色,差异度越大像素的颜色值可能为文字颜色的几率越大,提取差异度符合预设条件的像素颜色值作为文字区域的前景色,从而准确提取图片文字的前景色,这里使用的图片文字颜色提取方式无需开发者设置图片文字颜色,能够自动提取图片中文字颜色,并准确还原图片中文字的真实颜色。
本发明实施例提供了另一种图片文字颜色的提取方法,可以实现准确还原图片中文字的颜色信息的目的,如图2所示,该方法包括:
201、通过光学字符识别技术定位图片中的文字。
其中,光学字符识别技术可以将图片中的文字转换成字符,具体可以分两个步骤进行执行,首先是对图片中文本进行检测,将文字从图片中提取出来,然后对文本进行识别。
对于本发明实施例,在对图片中文本进行检测过程中,需要从图片中切割出可能存在的文字,这里的文字通常可以分为若干个连通区域,例如,文字“米”可能被分为3个区域,由于该文字上半部分两个点与文字下半部分不具有连通性,所以被拆分开了,进一步通过邻近搜索算法,来整合可能成为文字的区域,得到完整的文字。
202、利用文字宽度与间隙规则将图像中的文字划分为多个文字区域,得到图片中多个文字区域。
对于本发明实施例,在划分文字区域时,每个文字大小、文字的空隙以及单位水平距离中的文字个数等都是基本的特征,对于机器打印,图片中的文字常用竖直的间隔切分字符串,由于字体有限,每个字符的宽度相对固定,可以估计出一定距离内的字符数目。当然在图片中不同区域的文字可能字体大小以及间隙不相同,这里可以对初步切分的文字根据宽度规则进行判别,也可以加入行高作为判别依据,找出文字宽度以及间隙相同的文字,将图片中相邻并且文字宽度以及间隙相同的文字划分为一个文字区域。
需要说明的是,如果图片中的文字并非是规则的文字,很难判别出相同文字宽度与间隔,也可以通过获取相邻文字的文字宽度与间隙的相似度,将相似度高于预设数值的文字划分为一个文字区域。
203、根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况。
对于本发明实施例,由于图像矩阵对应的位置信息为已知的,根据图像矩阵对应的位置信息,可以获取图像矩阵各个顶点的位置信息,将距离图像矩阵各个顶点预设范围作为每个图像矩阵预设范围,并统计距离图像矩阵各个顶点预设范围内每个像素颜色以及相同颜色值的像素数量,得到所述图像矩阵对应像素颜色值的分布情况。
例如,以每个图像矩阵的4个顶点像素为中心取3*3矩阵,共计4*3*3=36个像素,遍历每个像素,获取像素RGB值,并统计RGB值相同的像素,得到36个像素中有20个像素的RGB值为(255,255,255),即为白色,说明图像矩阵预设范围内白色的分布最多,16个像素的RGB值为(0,0,0)即为黑色,说明图像矩阵预设范围内黑色的分布次之。
需要说明的是,由于距离各个定点预设范围内的像素是通过扩展生成的像素,可能并非在文字区域内的像素,如果文字区域在图片的边缘,扩展生成的像素可能会超出图片范围,若距离每个图像矩阵各个顶点预设范围内存在超出图片范围的像素,则说明该像素在图片中并非真实存在,无法统计像素颜色值,这里将超出图片范围的像素删除,以便于像素颜色值的统计。
204、提取在所述图像矩阵中相同颜色值的像素数量最多的颜色值作为所述文字区域的背景色。
对于本发明实施例,相同颜色值的像素数量能够反映图像矩阵对应像素颜色值的分布情况,相同颜色的像素数量越多,说明该颜色在图像矩阵中的分布越多,反之,相同颜色的像素数量越少,说明颜色在图像矩阵中分布越少,进一步提取分布最多像素颜色值作为文字区域的背景色。
205、遍历所述图像矩阵中的像素,获取像素在各个颜色通道的颜色值。
在RGB模式的图像矩阵中,每个像素的颜色值都由R、G、B三个颜色通道的颜色值决定,每个数值的范围都是0至255,随着R、G、B三个颜色通道的颜色值的不断变化,可以形成不同的像素颜色值。
对于本发明实施例,具体可以通过获取指定兼容位图的位,遍历图像矩阵中的每个像素,通过读取每个像素,根据每个像素对应的返回类型将像素转换为十六进制的颜色值,从而算出每个像素在R、G、B三个颜色通道的颜色值。
206、根据所述像素在各个颜色通道的颜色值以及所述文字区域的背景色在各个颜色通道的颜色值,计算所述图像矩阵中像素在颜色上与所述文字区域的背景色之间的差异度。
通常情况下,文字区域中文字的颜色也就是文字的前景色与文字背景色是不相同的,具有一定程度的反差,如果两者颜色一致,那么该文字区域中无法正常显示文字,所以图像矩阵中像素颜色值与背景色的差异越大,说明该颜色为图片区域中文字的颜色可能性越大。
在获取到图像矩阵中像素在各个颜色通道上的颜色值以及文字区域的背景色在各个颜色通道上的颜色值之后,上述计算图像矩阵中每个像素颜色值与文字区域的背景色之间的差异度可以通过下述公式实现:
其中,diff为图像矩阵中第n个像素与文字区域的背景色之间的差异度,rn为图像矩阵中第n个像素在红色通道上的颜色值,gn为图像矩阵中第n个像素在绿色通道上的颜色值,bn为图像矩阵中第n个像素在蓝色通道上的颜色值,rbg为文字区域的背景色在红色通道上的颜色值,gbg为文字区域的背景色在红色通道上的颜色值,bbg为文字区域的背景色在红色通道上的颜色值。
207、从所述差异度排名在预设数值之前的像素中选择分布最多的像素颜色值作为所述文字区域的前景色。
对于本发明实施例,具体可以统计差异度排名前N的每个像素的颜色值以及相同颜色值的像素数量,得到差异度排名前N中像素颜色值的分布情况,进一步从所述差异度排名在预设数值之前的像素中选择相同颜色值的像素数量最多的颜色值作为所述文字区域的前景色。
示例性的,可以统计差异度排名列表,该列表中记录每个像素在颜色上与文字区域的背景色之间的差异度,同时统计每个像素在文字区块中相同颜色值的像素数量,并对差异度进行排序,查找排名前30个像素,并获取排名前30个像素中相同颜色值的像素数量最多的颜色值作为文字区域的前景色。
需要说明的是,差异度排名越靠前虽然能够说明像素颜色与文字区域的背景色具有明显区别,但是也有可能是图像矩阵中个别文字对应像素的颜色比较突出,但并不能说明整体的文字颜色,这里选择将相同颜色像素数量最多的颜色值作为文字区域的前景色,更具有准确性。
本发明实施例提供的图片文字颜色的提取方法,与目前通过开发者预先根据图片的真实颜色设置图片中文字的颜色信息的方式相比,本发明能够直接应用在图片中的文字区域上,并将文字区域映射为图像矩阵,通过统计在图像矩阵预设范围内像素颜色值的分布情况,该分布情况能够体现文字区域背景在各个颜色上的比重,提取在图像矩阵中分布最多的像素颜色值作为文字区域的背景色,从而准确提取图片文字的背景色,通过计算图像矩阵中像素颜色值与文字区域的前景色之间的差异度,该差异度能够反映文字区域内的文字颜色,差异度越大像素的颜色值可能为文字颜色的几率越大,提取差异度符合预设条件的像素颜色值作为文字区域的前景色,从而准确提取图片文字的前景色,这里使用的图片文字颜色提取方式无需开发者设置图片文字颜色,能够自动提取图片中文字颜色,并准确还原图片中文字的真实颜色。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种图片文字颜色的提取装置,如图3所示,所述装置包括:获取单元31、第一提取单元32、第二提取单元33。
获取单元31,可以用于获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息;
第一提取单元32,可以用于根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色;
第二提取单元33,可以用于计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。
本发明实施例提供的图片文字颜色的提取装置,与目前通过开发者预先根据图片的真实颜色设置图片中文字的颜色信息的方式相比,本发明能够直接应用在图片中的文字区域上,并将文字区域映射为图像矩阵,通过统计在图像矩阵预设范围内像素颜色值的分布情况,该分布情况能够体现文字区域背景在各个颜色上的比重,提取在图像矩阵中分布最多的像素颜色值作为文字区域的背景色,从而准确提取图片文字的背景色,通过计算图像矩阵中像素颜色值与文字区域的前景色之间的差异度,该差异度能够反映文字区域内的文字颜色,差异度越大像素的颜色值可能为文字颜色的几率越大,提取差异度符合预设条件的像素颜色值作为文字区域的前景色,从而准确提取图片文字的前景色,这里使用的图片文字颜色提取方式无需开发者设置图片文字颜色,能够自动提取图片中文字颜色,并准确还原图片中文字的真实颜色。
在具体的应用场景中,如图4所示,所述获取单元31包括:
定位模块311,可以用于通过光学字符识别技术定位图片中的文字;
划分模块312,可以用于利用文字宽度与间隙规则将图像中的文字划分为多个文字区域,得到图片中多个文字区域。
进一步地,所述第一提取单元32包括:
统计模块321,可以用于根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况;
提取模块322,可以用于提取在所述图像矩阵中相同颜色值的像素数量最多的颜色值作为所述文字区域的背景色。
进一步地,所述统计模块321,具体可以用于根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息;
所述统计模块321,具体还可以用于统计距离所述图像矩阵各个顶点预设范围内每个像素颜色以及相同颜色值的像素数量,得到所述图像矩阵对应像素颜色值的分布情况。
进一步地,述第一提取单元32还包括:
删除模块323,可以用于在所述根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息之后,若距离所述图像矩阵各个顶点预设范围内存在超出图片范围的像素,则将所述超出图片范围的像素删除。
进一步地,所述第二提取单元33包括:
获取模块331,可以用于遍历所述图像矩阵中的像素,获取像素在各个颜色通道的颜色值;
计算模块332,可以用于根据所述像素在各个颜色通道的颜色值以及所述文字区域的背景色在各个颜色通道的颜色值,计算所述图像矩阵中像素在颜色上与所述文字区域的背景色之间的差异度;
选择模块333,可以用于从所述差异度排名在预设数值之前的像素中选择分布最多的像素颜色值作为所述文字区域的前景色。
进一步地,所述选择模块333,具体可以用于统计所述差异度排名在预设数值之前的像素颜色值以及相同颜色值的像素数量,得到所述差异度排名在预设数值之前的像素颜色值的分布情况;
选择模块333,具体还可以用于从所述差异度排名在预设数值之前的像素中选择相同颜色值的像素数量最多的颜色值作为所述文字区域的前景色。
需要说明的是,本实施例提供的一种图片文字颜色的提取装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的图片文字颜色的提取方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的图片文字颜色的提取方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的图片文字颜色的提取的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前现有技术相比,能够直接应用在图片中的文字区域上,并将每个文字区域映射为一个图像矩阵,通过统计在每个图像矩阵预设范围内像素颜色值的分布情况,该分布情况能够体现文字区域背景在各个颜色上的比重,提取在多个图像矩阵中分布最多的像素值作为文字区域的背景色,从而准确提取图片文字的背景色,通过计算图像矩阵中每个像素颜色值与文字区域的前景色之间的差异度,该差异度能够反映文字区域内的文字颜色,差异度越大像素的颜色值可能为文字颜色的几率越大,提取差异度符合预设条件的像素值作为文字区域的前景色,从而准确提取图片文字的前景色,该图片文字颜色的提取方式无需开发人员设置图片文字颜色,能够自动提取图片中文字颜色,并准确还原图片中文字的真实颜色。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种图片文字颜色的提取方法,其特征在于,包括:
获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息;
根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色;
计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。
2.根据权利要求1所述的方法,其特征在于,所述计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色包括:
遍历所述图像矩阵中的像素,获取像素在各个颜色通道的颜色值;
根据所述像素在各个颜色通道的颜色值以及所述文字区域的背景色在各个颜色通道的颜色值,计算所述图像矩阵中像素在颜色上与所述文字区域的背景色之间的差异度;
从所述差异度排名前N的像素中选择分布最多的像素颜色值作为文字区域的前景色。
3.根据权利要求2所述的方法,其特征在于,所述从所述差异度排名在预设数值之前的像素中选择分布最多的像素颜色值作为所述文字区域的前景色包括:
统计所述差异度排名在预设数值之前的像素颜色值以及相同颜色值的像素数量,得到所述差异度排名在预设数值之前的像素颜色值的分布情况;
从所述差异度排名在预设数值之前的像素中选择相同颜色值的像素数量最多的颜色值作为所述文字区域的前景色。
4.根据权利要求1所述的方法,其特征在于,所述根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色包括:
根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况;
提取在所述图像矩阵中相同颜色值的像素数量最多的颜色值作为所述文字区域的背景色。
5.根据权利要求4所述的方法,其特征在于,所述根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色以及相同颜色值的像素数量,得到所述图像矩阵中像素颜色值的分布情况包括:
根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息;
统计距离所述图像矩阵各个顶点预设范围内每个像素颜色以及相同颜色值的像素数量,得到所述图像矩阵对应像素颜色值的分布情况。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述图像矩阵对应的位置信息,获取所述图像矩阵各个顶点的位置信息之后,所述方法还包括:
若距离所述图像矩阵各个顶点预设范围内存在超出图片范围的像素,则将所述超出图片范围的像素删除。
7.根据权利要求1所述的方法,其特征在于,所述获取图片中的文字区域包括:
通过光学字符识别技术定位图片中的文字;
利用文字宽度与间隙规则将图像中的文字划分为多个文字区域,得到图片中多个文字区域。
8.一种图片文字颜色的提取装置,其特征在于,包括:
获取单元,用于获取图片中的文字区域,并将所述文字区域映射为图像矩阵,所述图像矩阵在图片中对应有位置信息;
第一提取单元,用于根据所述图像矩阵对应的位置信息,统计在所述图像矩阵预设边界范围内像素颜色值的分布情况,提取在所述图像矩阵中分布最多的像素颜色值作为所述文字区域的背景色;
第二提取单元,用于计算所述图像矩阵中像素颜色值与所述文字区域的背景色之间的差异度,提取所述差异度符合预设条件的像素颜色值作为文字区域的前景色。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811095558.7A 2018-09-19 2018-09-19 一种图片文字颜色的提取方法及装置 Pending CN109447086A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811095558.7A CN109447086A (zh) 2018-09-19 2018-09-19 一种图片文字颜色的提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811095558.7A CN109447086A (zh) 2018-09-19 2018-09-19 一种图片文字颜色的提取方法及装置

Publications (1)

Publication Number Publication Date
CN109447086A true CN109447086A (zh) 2019-03-08

Family

ID=65530698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811095558.7A Pending CN109447086A (zh) 2018-09-19 2018-09-19 一种图片文字颜色的提取方法及装置

Country Status (1)

Country Link
CN (1) CN109447086A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188764A (zh) * 2019-05-31 2019-08-30 浙江口碑网络技术有限公司 字符颜色识别处理方法及装置
CN110795659A (zh) * 2019-09-25 2020-02-14 口碑(上海)信息技术有限公司 页面背景图的生成方法及其装置
CN111105469A (zh) * 2019-12-18 2020-05-05 河海大学 一种基于图和局部盒子搜索获取团块的计算方法
CN111145126A (zh) * 2019-12-31 2020-05-12 陈文海 一种图像文字快速抹除方法
CN113112445A (zh) * 2020-01-09 2021-07-13 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN113255412A (zh) * 2020-02-13 2021-08-13 北京小米松果电子有限公司 文档图像的处理方法、装置及介质
CN113742025A (zh) * 2021-09-17 2021-12-03 北京字跳网络技术有限公司 页面生成方法、装置、设备和存储介质
CN114078452A (zh) * 2020-08-14 2022-02-22 华为技术有限公司 调节内容对比度的方法、电子设备和存储介质
CN115599384A (zh) * 2022-12-14 2023-01-13 深圳市明源云科技有限公司(Cn) 图片文字生成方法、装置、设备及其存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1419679A (zh) * 2000-03-14 2003-05-21 英特尔公司 估计文本颜色和图像的分割
CN102136064A (zh) * 2011-03-24 2011-07-27 成都四方信息技术有限公司 一种图像文字识别系统
CN102306276A (zh) * 2011-07-07 2012-01-04 北京云加速信息技术有限公司 基于分块聚类的视频车辆图像中车身颜色识别方法
GB2526838A (en) * 2014-06-04 2015-12-09 Imagination Tech Ltd Relightable texture for use in rendering an image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1419679A (zh) * 2000-03-14 2003-05-21 英特尔公司 估计文本颜色和图像的分割
CN102136064A (zh) * 2011-03-24 2011-07-27 成都四方信息技术有限公司 一种图像文字识别系统
CN102306276A (zh) * 2011-07-07 2012-01-04 北京云加速信息技术有限公司 基于分块聚类的视频车辆图像中车身颜色识别方法
GB2526838A (en) * 2014-06-04 2015-12-09 Imagination Tech Ltd Relightable texture for use in rendering an image

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DATAXDATA: "求助绘图功能问题", 《HTTPS://BBS.CSDN.NET/TOPICS/390296428?PAGE=1》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188764A (zh) * 2019-05-31 2019-08-30 浙江口碑网络技术有限公司 字符颜色识别处理方法及装置
CN110795659A (zh) * 2019-09-25 2020-02-14 口碑(上海)信息技术有限公司 页面背景图的生成方法及其装置
CN111105469A (zh) * 2019-12-18 2020-05-05 河海大学 一种基于图和局部盒子搜索获取团块的计算方法
CN111105469B (zh) * 2019-12-18 2023-02-14 河海大学 一种基于图和局部盒子搜索获取团块的计算方法
CN111145126B (zh) * 2019-12-31 2023-04-07 陈文海 一种图像文字快速抹除方法
CN111145126A (zh) * 2019-12-31 2020-05-12 陈文海 一种图像文字快速抹除方法
CN113112445A (zh) * 2020-01-09 2021-07-13 阿里巴巴集团控股有限公司 数据处理方法、装置和系统
CN113255412A (zh) * 2020-02-13 2021-08-13 北京小米松果电子有限公司 文档图像的处理方法、装置及介质
CN113255412B (zh) * 2020-02-13 2023-11-24 北京小米松果电子有限公司 文档图像的处理方法、装置及介质
CN114078452A (zh) * 2020-08-14 2022-02-22 华为技术有限公司 调节内容对比度的方法、电子设备和存储介质
CN114078452B (zh) * 2020-08-14 2022-12-27 华为技术有限公司 调节内容对比度的方法、电子设备和存储介质
CN113742025A (zh) * 2021-09-17 2021-12-03 北京字跳网络技术有限公司 页面生成方法、装置、设备和存储介质
CN115599384A (zh) * 2022-12-14 2023-01-13 深圳市明源云科技有限公司(Cn) 图片文字生成方法、装置、设备及其存储介质

Similar Documents

Publication Publication Date Title
CN109447086A (zh) 一种图片文字颜色的提取方法及装置
US7602527B2 (en) Album creating apparatus, album creating method and program
CN105122306B (zh) 区域分割方法以及检查装置
CN101911118B (zh) 肤色评价方法、肤色评价装置、肤色评价程序、以及存储了该程序的存储介质
US8090196B2 (en) Album creating apparatus, album creating method and computer readable medium storing thereon program therefor
KR100658998B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 그 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
US9679386B2 (en) Image processing device capable of segmenting an image into plural areas
US10067646B2 (en) Color selector for desktop publishing
EP2977932B1 (en) Image processing apparatus, image processing method and image processing program
US20040165000A1 (en) Picture layout processing apparatus, picture layout processing method, and program therefor
JP5842441B2 (ja) 画像処理装置およびプログラム
CN110084871B (zh) 图像排版方法及装置、电子终端
CN104951495A (zh) 用于管理代表性视频图像的设备和方法
JP2015041254A (ja) Trimap生成装置、Trimap生成方法、及びプログラム
CN102439559A (zh) 字符显示方法和装置
US10964288B2 (en) Automatically adapt user interface color scheme for digital images and video
KR20180108799A (ko) 안면 모델 편집 방법 및 장치
CN108269260B (zh) 动态影像去背方法、系统与计算机可读取存储装置
US20180336684A1 (en) Image processing device, image processing method, and information storage medium
US11062171B2 (en) Data capturing method and system thereof
US20030053718A1 (en) Image processing apparatus and method, and program
CN113345038B (zh) 刺绣图像的处理方法、装置、电子设备及存储介质
US7330589B2 (en) Image partitioning apparatus and method
CN111862271B (zh) 显示区域填充方法、装置、设备及存储介质
CN113223117A (zh) 图像处理方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190308