CN115187987A - 特殊区域外文本识别方法、装置、电子设备及存储介质 - Google Patents

特殊区域外文本识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115187987A
CN115187987A CN202210701729.6A CN202210701729A CN115187987A CN 115187987 A CN115187987 A CN 115187987A CN 202210701729 A CN202210701729 A CN 202210701729A CN 115187987 A CN115187987 A CN 115187987A
Authority
CN
China
Prior art keywords
image
sub
target
determining
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210701729.6A
Other languages
English (en)
Inventor
孙铁
冯德亮
蔡妙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202210701729.6A priority Critical patent/CN115187987A/zh
Publication of CN115187987A publication Critical patent/CN115187987A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18105Extraction of features or characteristics of the image related to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18124Extraction of features or characteristics of the image related to illumination properties, e.g. according to a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本申请实施例公开了一种特殊区域外文本识别方法、装置、电子设备及存储介质。方法包括:电子设备通过将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;根据每一子图像的图像特征在多个子图像中确定出目标图像;确定目标图像在待识别图像中对应的目标区域;在待识别图像中确定出在目标区域以外的目标识别图像;对目标识别图像进行文本识别,得到识别文本。该特殊区域外文本识别方法能够根据子图像的图像特征准确的定位到需要识别的内容。

Description

特殊区域外文本识别方法、装置、电子设备及存储介质
技术领域
本申请涉及图像处理技术领域,具体涉及一种特殊区域外文本识别方法、装置、电子设备及存储介质。
背景技术
现有技术中,在文本识别的过程中,往往是对整页图像进行识别,从而获取其中的文本内容。
但是,在整页图像中包含了一些插画、图片、图标等不需要识别的内容,如果对整页内不需要识别内容进行了识别,则会导致识别出的文件中出现排版错乱、文字错乱等现象。
发明内容
本申请实施例提供一种特殊区域外文本识别方法、装置、电子设备及存储介质。该特殊区域外文本识别方法能够准确的定位到需要识别的内容。
第一方面,本申请实施例提供了一种特殊区域外文本识别方法,包括:
将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;
根据每一子图像的图像特征在多个子图像中确定出目标图像;
确定目标图像在待识别图像中对应的目标区域;
在待识别图像中确定出在目标区域以外的目标识别图像;
对目标识别图像进行文本识别,得到识别文本。
第二方面,本申请实施例提供了一种特殊区域外文本识别装置,包括:
分割模块,用于将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;
第一确定模块,用于根据每一子图像的图像特征在多个子图像中确定出目标图像;
第二确定模块,用于确定目标图像在待识别图像中对应的目标区域;
第三确定模块,用于在待识别图像中确定出在目标区域以外的目标识别图像;
识别模块,用于对目标识别图像进行文本识别,得到识别文本。
第三方面,本申请实施例提供了一种电子设备,包括:存储有可执行程序代码的存储器、与存储器耦合的处理器;处理器调用存储器中存储的可执行程序代码,执行本申请实施例提供的特殊区域外文本识别方法中的步骤。
第四方面,本申请实施例提供了一种存储介质,存储介质存储有多条指令,指令适于处理器进行加载,以本申请实施例提供的特殊区域外文本识别方法中的步骤。
本申请实施例中,电子设备通过将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;根据每一子图像的图像特征在多个子图像中确定出目标图像;确定目标图像在待识别图像中对应的目标区域;在待识别图像中确定出在目标区域以外的目标识别图像;对目标识别图像进行文本识别,得到识别文本。该特殊区域外文本识别方法能够根据子图像的图像特征准确的定位到需要识别的内容。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的特殊区域外文本识别方法的第一流程示意图。
图2是本申请实施例提供的特殊区域外文本识别方法的第二流程示意图。
图3是本申请实施例提供的文本识别的场景示意图。
图4是本申请实施例提供的特殊区域外文本识别装置的结构示意图。
图5是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在相关技术中,在文本识别的过程中,往往是对整页图像进行识别,从而获取其中的文本内容。
但是,在整页图像中包含了一些插画、图片、图标等不需要识别的内容,如果对整页内不需要识别内容进行了识别,则会导致识别出的文件中出现排版错乱、文字错乱等现象。
为了解决该技术问题,本申请实施例提供了一种特殊区域外文本识别方法、装置、电子设备及存储介质。该特殊区域外文本识别方法可以对准确的确定出待识别图像中需要识别的内容,然后对需要识别的内容进行识别。
请参阅图1,图1是本申请实施例提供的特殊区域外文本识别方法的第一流程示意图。该特殊区域外文本识别方法可以包括以下步骤:
110、将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征。
在将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征,电子设备可以先获取原始图像,然后对原始图像的图像参数、方向信息进行校正,得到待识别图像。
比如,电子设备可以将原始图像的对比度调高,使得文本部分更加容易被识别出来。将原始图像的图像方向调整为预设方向,使得文本部分更加容易被识别出来。对原始图像进行校正处理之后,则得到待识别图像。
在一些实施方式中,电子设备可以确定待识别图像的尺寸信息,并确定尺寸信息对应的目标尺寸范围;确定目标尺寸范围对应的目标数量,将待识别图像分割为目标数量的子图像。
比如,针对于不同尺寸的待识别图像,当待识别图像的尺寸越大时,则可以分割出较多数量的子图像。当待识别图像的尺寸越小时,则可以分割出较少数量的子图像。这样就使得待识别图像的子图像拥有合适的数量,以及每个子图像拥有的合适的尺寸,从而有利于提高电子设备对子图像的处理效率。
又比如,在电子设备中可以预先设置多个尺寸范围,每一尺寸范围均有对应的目标数量,该尺寸范围可以是面积范围。然后电子设备确定出待识别图像的尺寸信息,当该尺寸信息属于某一尺寸范围内时,则将该尺寸范围对应的目标数量确定为待识别图像需要分割的子图像的数量。最后根据目标数量对待识别图像进行图像分割。
在一些实施方式中,电子设备还可以确定待识别图像的颜色分布信息;根据颜色分布信息将待识别图像分割为多个子图像。
比如,在待识别图像中,可能存在多种颜色的背景,如果某一颜色的连续覆盖面积大于预设面积,则将该颜色连续覆盖面积对应的区域在待识别图像中分割出来,从而得到该区域对应的子图像。
又比如,电子设备还可以确定相邻的相同色系的颜色,然后将相同色系的颜色对应的区域确定为需要进行图像分割的区域,在待识别图像中对该区域进行图像分割,从而得到子图像。
120、根据每一子图像的图像特征在多个子图像中确定出目标图像。
在一些实施方式中,电子设备可以确定每一子图像中的线条组合,然后确定线条组合对应的线条流向信息,将线条流向信息确定为图像特征。
可以理解的是,现有文字往往是固定的线条组合,文字对应的线条组合拥有固定的规律性。而图画、插画、手绘画等图形的线条往往具备不固定性、无规律行,即随机性较强。
电子设备可以通过对每一子图像进行图像识别,从而得到每一子图像对应的线条组合以及线条组合对应的线条流向信息,然后根据线条流向信息在多个子图像中确定出目标图像。
在一些实施方式中,电子设备可以根据线条流向信息,在多个子图像中确定出无规律的线条组合;将无规律的线条组合对应的子图像确定为目标图像。
比如,电子设备可以根据线条流向信息确定每相邻两个线条之间的相对位置信息,然后将多个相邻两个线条之间的相对位置信息确定为该线条组合的线条组合信息。然后利用该线条组合信息和数据库进行对比,确定是否有相同的线条组合信息,若没有,则确定该线条组合为无规律的线条组合,并将无规律的线条组合对应的子图像确定为目标图像。
其中,该数据库为包含了多个文字对应的线条组合信息的数据库,其中,每个文字对应的线条组合信息包括该文字的每相邻两个线条之间的相对位置信息。
当确定出无规律的线条组合对应的子图像后,说明该子图像没有文字信息,而是图画、插画等对应的图像。
在一些实施方式中,电子设备还可以获取线条流向信息对应的模板数据库,模板数据库包含多种证件图像分别对应的线条流向信息;将线条流向信息和模板数据库进行匹配;将匹配成功的线条流向信息对应的子图像确定为目标图像。
可以理解的是,针对一些证件均有对应的图像,比如身份证上有国徽图像;又比如护照有每个国家的护照图案;再比如银行使用的单据中,不同单据中有不同的图案。
电子设备可以预先存储多种证件图像分别对应的线条流向信息,从而生成模板数据库。
当电子设备获取到每个子图像的线条流向信息之后,可以直接利用该线条流向信息和模板数据库进行匹配,将匹配成功的线条流向信息对应的子图像确定为目标图像。也就是说,匹配成功的子图像是包含图案或者插画的图像,将其确定为目标图像。
130、确定目标图像在待识别图像中对应的目标区域。
在一些方式中,电子设备在确定出目标图像之后,可以确定目标图像的边缘位置信息,然后将在待识别图像中确定出边缘位置信息对应的围绕的区域,将该围绕的区域确定为目标区域。
比如,电子设备可以获取目标图像的边缘的坐标,然后利用该边缘的坐标在待识别图像中确定出一个区域,该区域就是目标区域。
140、在待识别图像中确定出在目标区域以外的目标识别图像。
可以理解的是,在目标区域中的图像是插画、图画等不需要识别的图像,电子设备可以直接跳过对目标区域的文本识别,电子设备可以对待识别图像中目标区域以外的目标识别图像进行文本识别,得到识别文本。
电子设备可以将待识别图像中目标区域以外的图像确认为目标识别图像。
150、对目标识别图像进行文本识别,得到识别文本。
在一些实施方式中,在得到识别文本之后,电子设备还可以将识别文本更新到待识别图像对应的区域上,同时对目标区域中的目标图像进行保留,从而使得最终输出的已识别图像拥有更好的排版,使得输出的已识别图像看起来更加美观。
在一些实施方式中,针对于本申请中的待识别图像的文本识别,可以是文本识别模型完成的。比如,当电子设备获取到待识别图像之后,电子设备可以将待识别图像输入到文本识别模型中,文本识别模型先将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征,然后根据图像特征在多个子图像中确定出目标图像,再确定目标图像在待识别图像中对应的目标区域,最后对待识别图像中目标区域以外的目标识别图像进行文本识别,得到识别文本。
在使用文本识别模型之前,还需要对文本识别模型进行训练,比如,可以将一些证件和一些单据输入到基础模型中,然后对基础模型进行训练,当基础模型能够准确的识别出目标图像以及目标区域以外的目标识别图像对应的文本内容之后,则认为该基础模型训练完成,从而得到文本识别模型。
在一些实施方式中,在将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征之前,电子设备还可以确定待识别图像的图像类型。
若图像类型为预设图像类型,比如,待识别图像的图像类型为证件或银行单据。则电子设备可以直接根据图像类型对待识别图像进行分割,比如在识别银行卡图像、身份证图像时,可以先确定银行卡图像、身份证图像的证件类别,然后根据证件类别找到包含图案的区域,然后将包含图案的区域确定为目标区域。
最后对待识别图像中目标区域以外的目标识别图像进行文本识别,得到识别文本。比如,电子设备自动跳过识别插画区域,然后对待识别区域进行识别,从而获取有用的文字信息,比如姓名、数字等。
本申请实施例中,电子设备通过将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;根据每一子图像的图像特征在多个子图像中确定出目标图像;确定目标图像在待识别图像中对应的目标区域;在待识别图像中确定出在目标区域以外的目标识别图像;对目标识别图像进行文本识别,得到识别文本。该特殊区域外文本识别方法能够根据子图像的图像特征准确的定位到需要识别的内容。
为了更加了解本申请实施例中提供的特殊区域外文本识别方法,请继续参阅图2,图2是本申请实施例提供的特殊区域外文本识别方法的第二流程示意图。该特殊区域外文本识别方法可以包括以下步骤:
201、获取原始图像,对原始图像的图像参数、方向信息进行校正,得到待识别图像。
在一些实施方式中,在电子设备得到原始图像后,可以对原始图像进行预处理,从而得到预处理图像,预处理图像更加有利于文本识别。原始图像可以是银行业务单、文档、照片等不同类型的图像。
原始图像可以是不同格式类型的图像,比如原始图像可以为pdf格式、peg格式等不同格式的图像。
在一些实施方式中,电子设备可以获取原始图像的文件格式,并将原始图像的文件格式转换为预设文件格式,得到待处理原始图像;然后对待处理原始图像进行预处理,得到预处理图像。
比如,原始图像为pdf格式的图像,可以先将原始图像转换为jpg格式的图像,该jpg格式的图像就是待处理原始图像。
然后,电子设备可以对待处理原始图像的图像方向和图像参数进行调整,得到待识别图像。
具体的,电子设备可以先将待处理原始图像的图像方向调整为预设方向,得到第一图像。比如,电子设备可以对待处理原始图像进行旋转,从而使得待处理原始图像的方向为预设方向,得到第一图像。
其中,图像参数可以包括亮度和对比度,电子设备可以对第一图像的亮度和/或对比度进行调节,得到待识别图像。比如,当第一图像的亮度过亮或者过暗时,不利于文本识别模型对第一图像的识别,此时可以将第一图像的亮度调整为预设的正常亮度,从而得到更加有利于文本识别的待识别图像。
又比如,当第一图像中的文本不够清晰时,可以通过调节对比度来进一步来突出文本和背景之间的区别。例如,第一图像中的背景为白色,文本为黑色,则可以通过调节对比度,使得背景中的白色更白,黑色更黑。从而得到更加有利于文本识别的待识别图像。
需要说明的是,在本申请实施例中,可以采用单一的方式来对第一图像进行调节,比如只采用亮度调节。还可以采用多种方式来对第一图像进行调节,比如采用对比度和亮度来共同调节图像。
图像参数除了对比度和亮度,图像参数中还可以包括其他参数,例如锐化程度、色温、颜色等等。电子设备均可以采用多种图像参数来对第一图像进行调节,从而得到待识别图像。
202、确定待识别图像的尺寸信息,并确定尺寸信息对应的目标尺寸范围。
可以理解的是,针对于不同尺寸的待识别图像,当待识别图像的尺寸越大时,则可以分割出较多数量的子图像。当待识别图像的尺寸越小时,则可以分割出较少数量的子图像。这样就使得待识别图像的子图像拥有合适的数量,以及每个子图像拥有的合适的尺寸,从而有利于提高电子设备对子图像的处理效率。
在电子设备中可以预先设置多个尺寸范围,每一尺寸范围均有对应的目标数量,该尺寸范围可以是面积范围。
电子设备可以确定出待识别图像的尺寸信息,并确定尺寸信息对应的目标尺寸范围。
203、确定目标尺寸范围对应的目标数量,将待识别图像分割为目标数量的子图像。
当该尺寸信息属于某一尺寸范围内时,则将该尺寸范围对应的目标数量确定为待识别图像需要分割的子图像的数量。最后根据目标数量对待识别图像进行图像分割。从而得到多个子图像。
204、确定每一子图像中的线条组合。
可以理解的是,现有文字往往是固定的线条组合,文字对应的线条组合拥有固定的规律性。而图画、插画、手绘画等图形的线条往往具备不固定性、无规律行,即随机性较强。
电子设备可以对每一子图像进行扫描,从而得到每一子图像中的线条组合。
205、确定线条组合对应的线条流向信息,将线条流向信息确定为图像特征。
在一些实施方式中,每一线条组合对应的线条流向信息可以为该图像的图像特征。
206、获取线条流向信息对应的模板数据库,模板数据库包含多种证件图像分别对应的线条流向信息。
可以理解的是,针对一些证件均有对应的图像,比如身份证上有国徽图像;又比如护照有每个国家的护照图案;再比如银行使用的单据中,不同单据中有不同的图案。电子设备可以预先存储多种证件图像分别对应的线条流向信息,从而生成模板数据库。
207、将线条流向信息和模板数据库进行匹配,将匹配成功的线条流向信息对应的子图像确定为目标图像。
当电子设备获取到每个子图像的线条流向信息之后,可以直接利用该线条流向信息和模板数据库进行匹配,将匹配成功的线条流向信息对应的子图像确定为目标图像。也就是说,匹配成功的子图像是包含图案或者插画的图像,将其确定为目标图像。
208、确定需要识别的内容的标题名称,并在目标识别图像中确定标题名称对应的目标识别区域。
在一些实施方式中,在针对于不同的文本识别场景中,需要识别的内容也是不同的,比如针对于银行业务单中,有用户和银行的协议内容。
电子设备可以待识别图像的图像类别确定出待识别图像对应的标题名称,比如待识别图像为银行业务单,则需要识别的内容有“协议”、“签名”。则电子设备可以确定出“协议”、“签名”对应的目标识别区域。
209、对目标识别区域中的图像进行识别,得到识别文本。
在一些实施方式中,电子设备可以对“协议”、“签名”对应的目标识别区域进行图像识别,从而得到识别文本,该识别文本中包含了协议内容和签名内容。
在本申请实施例中,电子设备通过获取原始图像,对原始图像的图像参数、方向信息进行校正,得到待识别图像。然后确定待识别图像的尺寸信息,并确定尺寸信息对应的目标尺寸范围,确定目标尺寸范围对应的目标数量,将待识别图像分割为目标数量的子图像。再确定每一子图像中的线条组合,确定线条组合对应的线条流向信息,将线条流向信息确定为图像特征。
再获取线条流向信息对应的模板数据库,模板数据库包含多种证件图像分别对应的线条流向信息,将线条流向信息和模板数据库进行匹配,将匹配成功的线条流向信息对应的子图像确定为目标图像。最后确定需要识别的内容的标题名称,并在目标识别图像中确定标题名称对应的目标识别区域,对目标识别区域中的图像进行识别,得到识别文本。
从而避免了对待识别图像中的插画进行识别,实现了电子设备准确的确定出需要识别的区域,并对需要进行文本识别的区域进行文本识别。
请一并参阅图3,图3是本申请实施例提供的文本识别的场景示意图。
其中图像S1为文本区域图像,图像S2为图画区域图像。
当待识别图像输入到电子设备中进行识别后,电子设备可以将待识别图像分割为多个子图像,比如电子设备可以将待识别图像分割为图像S1和图像S2,然后确定每一子图像对应的线条组合。
可以理解的是,现有文字往往是固定的线条组合,文字对应的线条组合拥有固定的规律性。而图画、插画、手绘画等图形的线条往往具备不固定性、无规律行,即随机性较强。
其中图像S2中的线条组合是不规律的,随机性强,而图像S1中的线条组合是规律的,则电子设备可以只对图像S1进行文本识别,而不对图像S2进行文本识别。
这样就能够提升文本识别的效率,也避免了电子设备对图像S2识别之后出现乱码、排版错误等现象。
相应的,本申请实施例还提供了一种特殊区域外文本识别装置,如图4所示,图4是本申请实施例提供的特殊区域外文本识别装置的结构示意图。该特殊区域外文本识别装置可以包括:
分割模块310,用于将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征。
分割模块310,还用于确定待识别图像的尺寸信息,并确定尺寸信息对应的目标尺寸范围;
确定目标尺寸范围对应的目标数量,将待识别图像分割为目标数量的子图像。
分割模块310,还用于确定待识别图像的颜色分布信息;
根据颜色分布信息将待识别图像分割为多个子图像。
分割模块310,还用于确定每一子图像中的线条组合;
确定线条组合对应的线条流向信息,将线条流向信息确定为图像特征。
分割模块310,还用于获取原始图像,对原始图像的图像参数、方向信息进行校正,得到待识别图像。
第一确定模块320,用于根据图像特征在多个子图像中确定出目标图像。
第一确定模块320,还用于根据线条流向信息,在多个子图像中确定出无规律的线条组合;
将无规律的线条组合对应的子图像确定为目标图像。
第一确定模块320,还用于获取线条流向信息对应的模板数据库,模板数据库包含多种证件图像分别对应的线条流向信息;
将线条流向信息和模板数据库进行匹配;
将匹配成功的线条流向信息对应的子图像确定为目标图像。
第二确定模块330,用于确定目标图像在待识别图像中对应的目标区域。
第三确定模块340,用于在待识别图像中确定出在目标区域以外的目标识别图像。
识别模块350,用于对待识别图像中目标区域以外的目标识别图像进行文本识别,得到识别文本。
识别模块350,还用于确定需要识别的内容的标题名称;
在目标识别图像中确定标题名称对应的目标识别区域;
对目标识别区域中的图像进行识别,得到识别文本。
本申请实施例中,电子设备通过将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;根据每一子图像的图像特征在多个子图像中确定出目标图像;确定目标图像在待识别图像中对应的目标区域;在待识别图像中确定出在目标区域以外的目标识别图像;对目标识别图像进行文本识别,得到识别文本。该特殊区域外文本识别方法能够根据子图像的图像特征准确的定位到需要识别的内容。
相应的,本申请实施例还提供一种电子设备,如图5所示,该电子设备可以包括有一个或一个以上计算机可读存储介质的存储器401、输入单元402、显示单元403、传感器404、包括有一个或者一个以上处理核心的处理器405、以及电源406等部件。本领域技术人员可以理解,图5中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
存储器401可用于存储软件程序以及模块,处理器405通过运行存储在存储器401的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器401可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器401还可以包括存储器控制器,以提供处理器405和输入单元402对存储器401的访问。
输入单元402可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元402可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器405,并能接收处理器405发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元402还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元403可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元403可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器405以确定触摸事件的类型,随后处理器405根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图5中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
电子设备还可包括至少一种传感器404,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
处理器405是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器401内的软件程序和/或模块,以及调用存储在存储器401内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器405可包括一个或多个处理核心;优选的,处理器405可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器405中。
电子设备还包括给各个部件供电的电源406(比如电池),优选的,电源可以通过电源管理系统与处理器405逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源406还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备中的处理器405会加载存储器401上存储的计算机程序,处理器405通过加载计算机程序,从而实现各种功能:
将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;
根据每一子图像的图像特征在多个子图像中确定出目标图像;
确定目标图像在待识别图像中对应的目标区域;
在待识别图像中确定出在目标区域以外的目标识别图像;
对目标识别图像进行文本识别,得到识别文本。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种特殊区域外文本识别方法中的步骤。例如,该指令可以执行如下步骤:
将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;
根据每一子图像的图像特征在多个子图像中确定出目标图像;
确定目标图像在待识别图像中对应的目标区域;
在待识别图像中确定出在目标区域以外的目标识别图像;
对目标识别图像进行文本识别,得到识别文本。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种特殊区域外文本识别方法中的步骤,因此,可以实现本申请实施例所提供的任一种特殊区域外文本识别方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种特殊区域外文本识别方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种特殊区域外文本识别方法,其特征在于,包括:
将待识别图像分割为多个子图像,并在所述多个子图像中确定每一所子图像对应的图像特征;
根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像;
确定所述目标图像在所述待识别图像中对应的目标区域;
在所述待识别图像中确定出在所述目标区域以外的目标识别图像;
对所述目标识别图像进行文本识别,得到识别文本。
2.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述将待识别图像分割为多个子图像,包括:
确定所述待识别图像的尺寸信息,并确定所述尺寸信息对应的目标尺寸范围;
确定所述目标尺寸范围对应的目标数量,将所述待识别图像分割为目标数量的所述子图像。
3.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述将待识别图像分割为多个子图像,包括:
确定所述待识别图像的颜色分布信息;
根据所述颜色分布信息将所述待识别图像分割为多个所述子图像。
4.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述确定每一所述子图像对应的图像特征,包括:
确定每一所述子图像中的线条组合;
确定所述线条组合对应的线条流向信息,将每一所述子图像的线条流向信息确定为每一所述子图像的图像特征。
5.根据权利要求4所述的特殊区域外文本识别方法,其特征在于,所述根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像,包括:
根据所述线条流向信息,在多个所述子图像中确定出无规律的线条组合;
将所述无规律的线条组合对应的所述子图像确定为所述目标图像。
6.根据权利要求4所述的特殊区域外文本识别方法,其特征在于,所述根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像,包括:
获取所述线条流向信息对应的模板数据库,所述模板数据库包含多种证件图像分别对应的线条流向信息;
将所述线条流向信息和所述模板数据库进行匹配;
将匹配成功的所述线条流向信息对应的所述子图像确定为所述目标图像。
7.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,在将待识别图像分割为多个子图像,并确定每一所述子图像对应的图像特征之前,所述方法还包括:
获取原始图像,对所述原始图像的图像参数、方向信息进行校正,得到所述待识别图像。
8.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述对所述目标识别图像进行文本识别,得到识别文本,包括:
确定需要识别的内容的标题名称;
在所述目标识别图像中确定所述标题名称对应的目标识别区域;
对所述目标识别区域中的图像进行识别,得到所述识别文本。
9.一种特殊区域外文本识别装置,其特征在于,包括:
分割模块,用于将待识别图像分割为多个子图像,并在所述多个子图像中确定每一所子图像对应的图像特征;
第一确定模块,用于根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像;
第二确定模块,用于确定所述目标图像在所述待识别图像中对应的目标区域;
第三确定模块,用于在所述待识别图像中确定出在所述目标区域以外的目标识别图像;
识别模块,用于对所述目标识别图像进行文本识别,得到识别文本。
10.一种电子设备,其特征在于,包括:
存储有可执行程序代码的存储器、与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1至8任一项所述的特殊区域外文本识别方法中的步骤。
11.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的特殊区域外文本识别方法中的步骤。
CN202210701729.6A 2022-06-20 2022-06-20 特殊区域外文本识别方法、装置、电子设备及存储介质 Pending CN115187987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210701729.6A CN115187987A (zh) 2022-06-20 2022-06-20 特殊区域外文本识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210701729.6A CN115187987A (zh) 2022-06-20 2022-06-20 特殊区域外文本识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115187987A true CN115187987A (zh) 2022-10-14

Family

ID=83514709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210701729.6A Pending CN115187987A (zh) 2022-06-20 2022-06-20 特殊区域外文本识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115187987A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116682209A (zh) * 2023-06-15 2023-09-01 南昌交通学院 一种基于机器视觉的自动售货机库存管理方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116682209A (zh) * 2023-06-15 2023-09-01 南昌交通学院 一种基于机器视觉的自动售货机库存管理方法及系统

Similar Documents

Publication Publication Date Title
CN109684980B (zh) 自动阅卷方法及装置
KR102240279B1 (ko) 컨텐트 처리 방법 및 그 전자 장치
CN111353458B (zh) 文本框标注方法、装置和存储介质
WO2016121401A1 (en) Information processing apparatus and program
CN110795019B (zh) 软键盘的按键识别方法、装置及存储介质
CN111461097A (zh) 识别图像信息的方法、装置、电子设备及介质
US20140348398A1 (en) Electronic apparatus and display control method
US20230260167A1 (en) Image processing method and apparatus
US11545061B2 (en) Electronic device for displaying screen through display in low-power mode and operating method thereof
EP3754636A1 (en) Method for compensating for screen movement of display and electronic device for supporting the same
CN115187987A (zh) 特殊区域外文本识别方法、装置、电子设备及存储介质
EP3753237B1 (en) Electronic device and control method thereof
CN110634095A (zh) 水印添加方法、水印识别方法、装置和电子设备
CN115187988A (zh) 区域文本识别方法、装置、电子设备及存储介质
CN115188001A (zh) 手写文本的识别方法、装置、电子设备及存储介质
CN115188003A (zh) 基于模型的文本识别方法、装置、电子设备及存储介质
KR102643243B1 (ko) 사용자 인터페이스에 대한 시인성 개선을 지원하기 위한 전자 장치
KR102458719B1 (ko) 사용자 입력을 지원하는 전자 장치 및 전자 장치의 제어 방법
KR102468082B1 (ko) 필기 입력에 대한 보정 방법, 이를 위한 전자 장치 및 저장 매체
CN110163192B (zh) 字符识别方法、装置及可读介质
US11481507B2 (en) Augmented reality document redaction
CN115187986A (zh) 文本识别方法、装置、电子设备及存储介质
CN115188012A (zh) 文本识别模型更新方法、装置、电子设备及存储介质
CN112308104A (zh) 异常识别方法、装置及计算机存储介质
WO2016121403A1 (en) Information processing apparatus, image processing system, and program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination