CN107845094B - 图像文字检测方法、装置及计算机可读存储介质 - Google Patents

图像文字检测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN107845094B
CN107845094B CN201711160550.XA CN201711160550A CN107845094B CN 107845094 B CN107845094 B CN 107845094B CN 201711160550 A CN201711160550 A CN 201711160550A CN 107845094 B CN107845094 B CN 107845094B
Authority
CN
China
Prior art keywords
image
connected region
gray value
target
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711160550.XA
Other languages
English (en)
Other versions
CN107845094A (zh
Inventor
张水发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201711160550.XA priority Critical patent/CN107845094B/zh
Publication of CN107845094A publication Critical patent/CN107845094A/zh
Application granted granted Critical
Publication of CN107845094B publication Critical patent/CN107845094B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本公开是关于一种图像文字检测方法、装置及计算机可读存储介质,所述方法包括:将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;根据所述图像矩阵,确定目标连通区域;根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字。通过上述技术方案,将图像映射到HSL空间可以获得图像中各像素点的亮度值,在图像的亮度较低时,也可以较好地区分亮度不同的区域。另外,通过对各个目标连通区域进行灰度值计算,可以在有效缩减检测范围的同时,提高检测效率和准确率,为后续的图像处理提供技术支持。

Description

图像文字检测方法、装置及计算机可读存储介质
技术领域
本公开涉及图像处理领域,尤其涉及一种图像文字检测方法、装置及计算机可读存储介质。
背景技术
在环境亮度较低时,拍摄所获得的图像中的亮度也会较低。相关技术中,对图像进行检测时,多采用RGB或者YUV等颜色编码方式对图像进行处理。此时,通过发光元件呈现的文字难以检测出来,从而难以对该图像进行细粒度分类等图像处理过程。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像文字检测方法、装置及计算机可读存储介质。
根据本公开实施例的第一方面,提供一种图像文字检测方法,包括:
将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
根据所述图像矩阵,确定目标连通区域;
根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字;
其中,所述根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字,包括:
获取所述目标连通区域中各个像素点的灰度值;
计算所述目标连通区域中各个像素点的灰度值的方差;
在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
可选地,所述根据所述图像矩阵,确定目标连通区域,包括:
根据所述图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,获得初始连通区域;
针对每个所述初始连通区域,在该初始连通区域包含的像素点的个数大于第一预设阈值时,将该初始连通区域确定为所述目标连通区域。
可选地,通过以下公式计算所述目标连通区域中各个像素点的灰度值的方差:
Figure GDA0002351274200000021
Figure GDA0002351274200000022
Y=(yij)w×h
其中,Y表示根据所述目标连通区域中各个像素点的灰度值形成的灰度值矩阵;
w表示所述目标连通区域中横向像素点的最大个数;
h表示所述目标连通区域中纵向像素点的最大个数;
yij表示所述灰度值矩阵Y中第i行第j列的元素值;
μ表示所述灰度值矩阵Y中各个元素值的平均值;
σ表示所述灰度值矩阵Y中各个元素值的方差,即,所述目标连通区域中各个像素点的灰度值的方差。
根据本公开实施例的第二方面,提供一种图像文字检测装置,包括:
映射模块,被配置为将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
第一确定模块,被配置为根据所述图像矩阵,确定目标连通区域;
第二确定模块,被配置为根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字;
其中,所述第二确定模块,包括:
获取子模块,被配置为获取所述目标连通区域中各个像素点的灰度值;
计算子模块,被配置为计算所述目标连通区域中各个像素点的灰度值的方差;
第二确定子模块,被配置为在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
可选地,所述第一确定模块,包括:
提取子模块,被配置为根据所述图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,获得初始连通区域;
第一确定子模块,被配置为针对每个所述初始连通区域,在该初始连通区域包含的像素点的个数大于第一预设阈值时,将该初始连通区域确定为所述目标连通区域。
可选地,所述计算子模块被配置为通过以下公式计算所述目标连通区域中各个像素点的灰度值的方差:
Figure GDA0002351274200000031
Figure GDA0002351274200000032
Y=(yij)w×h
其中,Y表示根据所述目标连通区域中各个像素点的灰度值形成的灰度值矩阵;
w表示所述目标连通区域中横向像素点的最大个数;
h表示所述目标连通区域中纵向像素点的最大个数;
yij表示所述灰度值矩阵Y中第i行第j列的元素值;
μ表示所述灰度值矩阵Y中各个元素值的平均值;
σ表示所述灰度值矩阵Y中各个元素值的方差,即,所述目标连通区域中各个像素点的灰度值的方差。
根据本公开实施例的第三方面,提供一种图像文字检测装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
根据所述图像矩阵,确定目标连通区域;
根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字;
其中,所述根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字,包括:
获取所述目标连通区域中各个像素点的灰度值;
计算所述目标连通区域中各个像素点的灰度值的方差;
在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的图像文字检测方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
将图像映射到HSL空间,从而获得基于HSL的色相H、饱和度S、亮度L三个颜色通道进行表示的图像矩阵。之后,可以根据该图像矩阵进行目标连通区域的提取,进一步获得用于文字检测的区域。在通过发光元件呈现的文字所成的图像中,由于该图像中的文字纹理,会使得图像中的文字部分呈现出灰度值不均匀的现象、非文字部分呈现出灰度值均匀的现象,因此,通过该区域中各个像素点的灰度值可以确定目标连通区域是否含有通过发光元件呈现的文字。通过上述技术方案,将图像映射到HSL空间可以获得图像中各像素点的亮度值,在图像的亮度较低时,也可以较好地区分亮度不同的区域。另外,通过对各个目标连通区域进行灰度值计算,可以在有效缩减检测范围的同时,提高检测效率和准确率,为后续的图像处理提供技术支持。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的图像文字检测方法的流程图;
图2是根据所述图像矩阵,确定目标连通区域的一种示例实现方式的流程图;
图3是根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字的一种示例实现方式的流程图;
图4是根据一示例性实施例示出的图像文字检测装置的框图;
图5是根据一示例性实施例示出的图像文字检测装置的第一确定模块的框图;
图6是根据一示例性实施例示出的图像文字检测装置的第二确定模块的框图;
图7是根据一示例性实施例示出的图像文字检测装置的框图;
图8是根据一示例性实施例示出的图像文字检测装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的图像文字检测方法的流程图,如图1所示,所述方法包括:
在S11中,将图像映射到HSL空间,以获得图像在HSL空间中对应的图像矩阵。
其中,HSL是一种颜色编码方法,是通过色相H、饱和度S、亮度L三个颜色通道的变化以及三者相互之间的叠加来表示各种颜色。从将图像映射到HSL空间所得的图像矩阵中,便可以得出各个像素点的亮度值。
在S12中,根据图像矩阵,确定目标连通区域。其中,所述目标连通区域为从该图像矩阵中提取出的全部或部分连通区域。
在一实施例中,可以对图像矩阵中的连通区域进行提取,并将提取出的各个连通区域确定为目标连通区域。
在另一实施例中,可以对图像矩阵中的连通区域进行提取,将满足预设条件的连通区域确定为目标连通区域。其中,该预设条件可以是该连通区域包含的像素点的个数大于一预设值。
可选地,图2所示,为所述根据所述图像矩阵,确定目标连通区域的一种示例实现方式,如图2所示,包括:
在S21中,根据图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,获得初始连通区域。
其中,该预设的亮度阈值可以是根据多次实验得出的、用于区分通过发光元件呈现的文字亮度和环境亮度的亮度阈值。示例地,所述发光元件可以是LED发光二极管、EL发光片等等。
在通过发光元件呈现的文字所成的图像中,通过发光元件呈现的文字的部分与其他部分相比,其亮度值较高,因此,可以首先根据图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,优先确定出可能含有通过发光元件呈现的文字的初始连通区域,有效缩减检测范围。
在S22中,针对每个初始连通区域,在该初始连通区域包含的像素点的个数大于第一预设阈值时,将该初始连通区域确定为目标连通区域。
其中,所述第一预设阈值可以用于区分各个初始连通区域的有效性。当初始连通区域包含的像素点的个数小于或等于第一预设阈值时,由于其包含的像素点个数较少,不足以进行相应的文字检测,可以将该初始连通区域确定为噪声区域,并将包含的像素点的个数大于第一预设阈值的初始连通区域确定为目标连通区域。通过上述技术方案,可以提高目标连通区域在进行文字检测时的有效性,在保证检测准确度的同时,减少提取出的目标连通区域的个数,从而可以进一步缩减检测范围,提高检测效率。
在S13中,根据目标连通区域中各个像素点的灰度值,确定目标连通区域内是否含有通过发光元件呈现的文字。
可选地,图3所示,为根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字的一种示例实现方式,如图3所示,包括:
在S31中,获取目标连通区域中各个像素点的灰度值。
示例地,可以通过将目标连通区域映射到YUV空间,获取目标连通区域中各个像素点的灰度值。YUV是一种颜色编码方法,是指通过灰度信号Y和两个色差信号B-Y(即U)、R-Y(即V)表示各种颜色的方法。将目标连通区域映射到YUV空间时,可以先将目标连通区域映射到RGB空间,之后再根据目标连通区域在RGB空间中对应的矩阵获得目标连通区域在YUV空间对应的矩阵,根据该矩阵,可以获得该目标连通区域中各个像素点的灰度值。其中,上述将所述目标连通区域映射到YUV空间的方式为一示例性实施例,本公开中对此不做限定。
示例地,还可以通过将目标连通区域映射到YCbCr空间或是HSB空间,获取目标连通区域中各个像素点的灰度值。其映射方式和获取方式与上述方式类似,在此不再赘述。
在S32中,计算目标连通区域中各个像素点的灰度值的方差。
其中,在通过发光元件呈现的文字所成的图像中,由于该图像中的文字纹理,会使得图像中的文字部分呈现出灰度值不均匀的现象、非文字部分呈现出灰度值均匀的现象。因此,可以通过计算目标连通区域中各个像素点的灰度值的方差判断该目标连通区域中是否含有通过发光元件呈现的文字。
可选地,可以通过以下公式计算所述目标连通区域中各个像素点的灰度值的方差:
Figure GDA0002351274200000081
Figure GDA0002351274200000082
Y=(yij)w×h
其中,Y表示根据所述目标连通区域中各个像素点的灰度值形成的灰度值矩阵;
w表示所述目标连通区域中横向像素点的最大个数;
h表示所述目标连通区域中纵向像素点的最大个数;
yij表示所述灰度值矩阵Y中第i行第j列的元素值;
μ表示所述灰度值矩阵Y中各个元素值的平均值;
σ表示所述灰度值矩阵Y中各个元素值的方差,即,所述目标连通区域中各个像素点的灰度值的方差。
其中,在灰度值矩阵Y中的元素,若其在目标连通区域中存在对应的像素点,则其元素值为该像素点的灰度值,若其在目标连通区域中不存在对应的像素点,则其元素值为0。
在S33中,在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
其中,所述第二预设阈值可以是根据多次测试实验得出的。当所述方差大于第二预设阈值时,表示该连通区域中的各个像素点的灰度值比较不均匀,此时,可以确定该目标连通区域内含有通过发光元件呈现的文字,反之,当所述方差小于或等于第二预设阈值时,表示该连通区域中的各个像素点的灰度值比较均匀,此时,可以确定该目标连通区域内不含有通过发光元件呈现的文字。
在上述技术方案中,获取该目标连通区域中的各个像素点的灰度值,从而根据该灰度值确定出该连通区域是否含有通过发光元件呈现的文字。通过上述技术方案,可以简单、准确地检测出含有通过发光元件呈现的文字的目标连通区域,并且,可以简化检测的步骤,提高图像文字检测的准确度和效率。
综上所述,将图像映射到HSL空间,从而获得基于HSL的色相H、饱和度S、亮度L三个颜色通道进行表示的图像矩阵。之后,可以根据该图像矩阵进行目标连通区域的提取,进一步获得用于文字检测的区域。在通过发光元件呈现的文字所成的图像中,由于该图像中的文字纹理,会使得图像中的文字部分呈现出灰度值不均匀的现象、非文字部分呈现出灰度值均匀的现象,因此,通过该区域中各个像素点的灰度值可以确定目标连通区域是否含有通过发光元件呈现的文字。通过上述技术方案,将图像映射到HSL空间可以获得图像中各像素点的亮度值,在图像的亮度较低时,也可以较好地区分亮度不同的区域。另外,通过对各个目标连通区域进行灰度值计算,可以在有效缩减检测范围的同时,提高检测效率和准确率,为后续的图像处理提供技术支持。
图4是根据一示例性实施例示出的图像文字检测装置的框图。参照图4,该装置10包括:
映射模块100,被配置为将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
第一确定模块200,被配置为根据所述图像矩阵,确定目标连通区域;
第二确定模块300,被配置为根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字。
可选地,图5是根据一示例性实施例示出的图像文字检测装置的第一确定模块的框图。如图5所示,所述第一确定模块200,包括:
提取子模块201,被配置为根据所述图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,获得初始连通区域;
第一确定子模块202,被配置为针对每个所述初始连通区域,在该初始连通区域包含的像素点的个数大于第一预设阈值时,将该初始连通区域确定为所述目标连通区域。
可选地,图6是根据一示例性实施例示出的图像文字检测装置的第二确定模块的框图。如图6所示,所述第二确定模块300,包括:
获取子模块301,被配置为获取所述目标连通区域中各个像素点的灰度值;
计算子模块302,被配置为计算所述目标连通区域中各个像素点的灰度值的方差;
第二确定子模块303,被配置为在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
可选地,所述计算子模块302被配置为通过以下公式计算所述目标连通区域中各个像素点的灰度值的方差:
Figure GDA0002351274200000111
Figure GDA0002351274200000112
Y=(yij)w×h
其中,Y表示根据所述目标连通区域中各个像素点的灰度值形成的灰度值矩阵;
w表示所述目标连通区域中横向像素点的最大个数;
h表示所述目标连通区域中纵向像素点的最大个数;
yij表示所述灰度值矩阵Y中第i行第j列的元素值;
μ表示所述灰度值矩阵Y中各个元素值的平均值;
σ表示所述灰度值矩阵Y中各个元素值的方差,即,所述目标连通区域中各个像素点的灰度值的方差。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的图像文字检测方法的步骤。
图7是根据一示例性实施例示出的一种图像文字检测装置700的框图。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电力组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述图像文字检测方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件706为装置700的各种组件提供电力。电力组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像文字检测方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述图像文字检测方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图8是根据一示例性实施例示出的一种图像文字检测装置800的框图。例如,装置800可以被提供为一服务器。参照图8,装置800包括处理组件822,其进一步包括一个或多个处理器,以及由存储器832所代表的存储器资源,用于存储可由处理组件822的执行的指令,例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件822被配置为执行指令,以执行上述图像文字检测方法。
装置800还可以包括一个电源组件826被配置为执行装置800的电源管理,一个有线或无线网络接口850被配置为将装置800连接到网络,和一个输入输出(I/O)接口858。装置800可以操作基于存储在存储器832的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (8)

1.一种图像文字检测方法,其特征在于,所述方法包括:
将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
根据所述图像矩阵,确定目标连通区域;
根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字;
其中,所述根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字,包括:
获取所述目标连通区域中各个像素点的灰度值;
计算所述目标连通区域中各个像素点的灰度值的方差;
在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
2.根据权利要求1所述的方法,其特征在于,所述根据所述图像矩阵,确定目标连通区域,包括:
根据所述图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,获得初始连通区域;
针对每个所述初始连通区域,在该初始连通区域包含的像素点的个数大于第一预设阈值时,将该初始连通区域确定为所述目标连通区域。
3.根据权利要求1所述的方法,其特征在于,通过以下公式计算所述目标连通区域中各个像素点的灰度值的方差:
Figure FDA0002351274190000011
Figure FDA0002351274190000021
Y=(yij)w×h
其中,Y表示根据所述目标连通区域中各个像素点的灰度值形成的灰度值矩阵;
w表示所述目标连通区域中横向像素点的最大个数;
h表示所述目标连通区域中纵向像素点的最大个数;
yij表示所述灰度值矩阵Y中第i行第j列的元素值;
μ表示所述灰度值矩阵Y中各个元素值的平均值;
σ表示所述灰度值矩阵Y中各个元素值的方差,即,所述目标连通区域中各个像素点的灰度值的方差。
4.一种图像文字检测装置,其特征在于,所述装置包括:
映射模块,被配置为将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
第一确定模块,被配置为根据所述图像矩阵,确定目标连通区域;
第二确定模块,被配置为根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字;
其中,所述第二确定模块包括:
获取子模块,被配置为获取所述目标连通区域中各个像素点的灰度值;
计算子模块,被配置为计算所述目标连通区域中各个像素点的灰度值的方差;
第二确定子模块,被配置为在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
5.根据权利要求4所述的装置,其特征在于,所述第一确定模块包括:
提取子模块,被配置为根据所述图像矩阵中亮度值大于预设的亮度阈值的像素点进行连通区域提取,获得初始连通区域;
第一确定子模块,被配置为针对每个所述初始连通区域,在该初始连通区域包含的像素点的个数大于第一预设阈值时,将该初始连通区域确定为所述目标连通区域。
6.根据权利要求4所述的装置,其特征在于,所述计算子模块被配置为通过以下公式计算所述目标连通区域中各个像素点的灰度值的方差:
Figure FDA0002351274190000031
Figure FDA0002351274190000032
Y=(yij)w×h
其中,Y表示根据所述目标连通区域中各个像素点的灰度值形成的灰度值矩阵;
w表示所述目标连通区域中横向像素点的最大个数;
h表示所述目标连通区域中纵向像素点的最大个数;
yij表示所述灰度值矩阵Y中第i行第j列的元素值;
μ表示所述灰度值矩阵Y中各个元素值的平均值;
σ表示所述灰度值矩阵Y中各个元素值的方差,即,所述目标连通区域中各个像素点的灰度值的方差。
7.一种图像文字检测装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
将图像映射到HSL空间,以获得所述图像在所述HSL空间中对应的图像矩阵;
根据所述图像矩阵,确定目标连通区域;
根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字;
其中,所述根据所述目标连通区域中各个像素点的灰度值,确定所述目标连通区域内是否含有通过发光元件呈现的文字,包括:
获取所述目标连通区域中各个像素点的灰度值;
计算所述目标连通区域中各个像素点的灰度值的方差;
在所述方差大于第二预设阈值时,确定所述目标连通区域内含有通过发光元件呈现的文字。
8.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1-3中任一项所述方法的步骤。
CN201711160550.XA 2017-11-20 2017-11-20 图像文字检测方法、装置及计算机可读存储介质 Active CN107845094B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711160550.XA CN107845094B (zh) 2017-11-20 2017-11-20 图像文字检测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711160550.XA CN107845094B (zh) 2017-11-20 2017-11-20 图像文字检测方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107845094A CN107845094A (zh) 2018-03-27
CN107845094B true CN107845094B (zh) 2020-06-19

Family

ID=61679821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711160550.XA Active CN107845094B (zh) 2017-11-20 2017-11-20 图像文字检测方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107845094B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109285126B (zh) * 2018-08-17 2022-09-09 上海商汤智能科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110490232B (zh) * 2019-07-18 2021-08-13 北京捷通华声科技股份有限公司 训练文字行方向预测模型的方法、装置、设备、介质
CN111557692B (zh) * 2020-04-26 2022-11-22 深圳华声医疗技术股份有限公司 目标器官组织的自动测量方法、超声测量装置及介质
CN113793316B (zh) * 2021-09-13 2023-09-12 合肥合滨智能机器人有限公司 一种超声扫查区域提取方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194117A (zh) * 2010-03-05 2011-09-21 北京大学 文稿页面方向检测方法和装置
EP2752791A1 (en) * 2006-01-27 2014-07-09 Tandent Vision Science, Inc. Method for identifying linear tokens in an image
CN104598907A (zh) * 2013-10-31 2015-05-06 同济大学 一种基于笔画宽度图的图像中文字数据提取方法
CN106250831A (zh) * 2016-07-22 2016-12-21 北京小米移动软件有限公司 图像检测方法、装置和用于图像检测的装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2752791A1 (en) * 2006-01-27 2014-07-09 Tandent Vision Science, Inc. Method for identifying linear tokens in an image
CN102194117A (zh) * 2010-03-05 2011-09-21 北京大学 文稿页面方向检测方法和装置
CN104598907A (zh) * 2013-10-31 2015-05-06 同济大学 一种基于笔画宽度图的图像中文字数据提取方法
CN106250831A (zh) * 2016-07-22 2016-12-21 北京小米移动软件有限公司 图像检测方法、装置和用于图像检测的装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于视觉显著性与颜色的复杂场景文字提取方法的研究;姜维;《中国博士学位论文全文数据库 (信息科技辑)》;20160315;摘要和第76页 *

Also Published As

Publication number Publication date
CN107845094A (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
US10157326B2 (en) Method and device for character area identification
CN107845094B (zh) 图像文字检测方法、装置及计算机可读存储介质
CN107563994B (zh) 图像的显著性检测方法及装置
US10650502B2 (en) Image processing method and apparatus, and storage medium
US10216976B2 (en) Method, device and medium for fingerprint identification
CN107463052B (zh) 拍摄曝光方法及装置
CN108154466B (zh) 图像处理方法及装置
CN107038428B (zh) 活体识别方法和装置
CN105528765B (zh) 处理图像的方法及装置
CN108122195B (zh) 图片处理方法及装置
CN107025441B (zh) 肤色检测方法及装置
US11574415B2 (en) Method and apparatus for determining an icon position
CN105678296B (zh) 确定字符倾斜角度的方法及装置
CN109215578B (zh) 屏幕显示方法及装置
CN112219224A (zh) 图像处理方法及装置、电子设备和存储介质
CN112116670A (zh) 信息处理方法及装置、电子设备及存储介质
CN113920465A (zh) 片尾识别方法、装置、电子设备及存储介质
CN111290723A (zh) 显示背景的调节方法、装置、终端及存储介质
CN104536713B (zh) 显示图像中的字符的方法及装置
CN107564047B (zh) 图像处理方法及装置、电子设备和计算机可读存储介质
CN112764659B (zh) 信息处理方法及装置、电子设备及存储介质
CN107292901B (zh) 边缘检测方法及装置
CN107527072B (zh) 确定相似头像的方法及装置、电子设备
US20180150978A1 (en) Method and device for processing a page
CN106469446B (zh) 深度图像的分割方法和分割装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant