CN114170451A - 一种文本识别方法和装置 - Google Patents
一种文本识别方法和装置 Download PDFInfo
- Publication number
- CN114170451A CN114170451A CN202111466431.3A CN202111466431A CN114170451A CN 114170451 A CN114170451 A CN 114170451A CN 202111466431 A CN202111466431 A CN 202111466431A CN 114170451 A CN114170451 A CN 114170451A
- Authority
- CN
- China
- Prior art keywords
- text
- list
- recognition result
- result
- preliminary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种文本识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:使用文字识别模型对图片进行文字识别处理得到初步识别结果;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。该实施方式实现了将文字识别的初步识别结果与预设的文本集合列表进行相似度比较,以对初步识别结果进行修正,提高了相似文本的识别准确率,保证了文本识别结果的可靠性,从而更好的应用于实际场景。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种文本识别方法和装置。
背景技术
随着数字信息化的发展,利用计算机自动识别字符的文字识别技术得到了快速的发展。以目前比较成熟的光学字符识别(Optical Character Recognition,OCR)为例,其利用光学技术和计算机技术实现文字字符识别,在证件识别、票据识别、车牌识别、文档识别等领域均有广泛应用。
在实现本发明过程中,发明人发现现有技术中存在如下问题:
通过文字识别引擎提取到的文本准确率不高,对于相似文本,无法做到准确识别,致使文字识别引擎提取到的文本结果不可靠,不能直接使用,不利于实际场景的应用。
发明内容
有鉴于此,本发明实施例提供一种文本识别方法和装置,通过将文字识别的初步识别结果与预设的文本集合列表进行相似度比较,实现对初步识别结果的修正,提高了相似文本的识别准确率,保证了文本识别结果的可靠性,从而更好的应用于实际场景。
为实现所述目的,根据本发明实施例的一个方面,提供了一种文本识别方法,包括:
使用文字识别模型对图片进行文字识别处理得到初步识别结果;
将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;
根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
可选地,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:将所述初步识别结果划分为:中文字符结果集合、外文字符结果集合和数字结果集合;将所述初步识别结果与预设的文本集合列表进行相似度比较包括:将所述中文字符结果集合、外文字符结果集合和数字结果集合,分别与预设的文本集合列表进行相似度比较。
可选地,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:确认所述初步识别结果包括的文本字符个数满足设定要求。
可选地,将所述初步识别结果与预设的文本集合列表进行相似度比较包括:将所述初步识别结果以文本行为单位,分别与预设的文本集合列表中的每行文本进行相似度比较。
可选地,所述满足要求的目标文本列表包括:与所述初步识别结果的文本行完全相同的所述文本集合列表中的文本;与所述初步识别结果的文本行具有文字包含关系的所述文本集合列表中的文本;与所述初步识别结果的文本行的字符相似度满足设定相似度阈值的所述文本集合列表中的文本。
可选地,所述文本集合列表是通过对即将使用到的文本集合,以行为单位进行预处理得到的,且所述文本集合列表中的每行文本具有次数属性;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表包括:将所述初步识别结果中的每个文本行分别与预设的文本集合列表进行相似度比较,得到所述每个文本行对应的目标文本;对每个文本行,获取对应的目标文本的次数属性值;对于所述初步识别结果中重复的文本行,若所述文本行的相似度比较次数与对应的目标文本的次数属性值相等,则将所述目标文本作为所述文本行对应的目标文本添加到目标文本列表中;否则,不添加到目标文本列表中。
可选地,对于所述初步识别结果中的文本行,在未得到与所述文本行对应的目标文本的情况下,将所述文本集合列表中与所述文本行相似度最高的文本按照预设格式进行汇总,并确认是否添加到所述文本集合列表中。
根据本发明实施例的第二方面,提供一种文本识别装置,包括:
初步识别结果获取模块,用于使用文字识别模型对图片进行文字识别处理得到初步识别结果;
文本对比模块,用于将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;
文本修正模块,用于根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
根据本发明实施例的第三方面,提供一种文本识别电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例第一方面提供的方法。
根据本发明实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例第一方面提供的方法。
所述发明中的一个实施例具有如下优点或有益效果:通过使用文字识别模型对图片进行文字识别处理得到初步识别结果;将初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据满足要求的目标文本列表对初步识别结果进行修正,得到最终的文本识别结果的技术方案,实现了将文字识别的初步识别结果与预设的文本集合列表进行相似度比较,以对初步识别结果进行修正,提高了相似文本的识别准确率,保证了文本识别结果的可靠性,从而更好的应用于实际场景。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的文本识别方法的主要流程的示意图;
图2是本发明实施例的文本识别方法的总体流程示意图;
图3是本发明实施例的文本识别方法的详细流程示意图;
图4是根据本发明实施例的文本识别装置的主要模块示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前通过文字识别引擎提取到的文本准确率不高,对于相似文本,无法做到准确识别,致使文字识别引擎提取到的文本结果不可靠,不能直接使用,不能很好的满足实际应用。比如:对于0与o即为相似文本,通过文字识别引擎进行识别时很容易出现识别错误的情况。
为了解决现有技术中存在的上述问题,本发明提出一种文本识别方法,通过将文字识别的初步识别结果与预设的文本集合列表进行相似度比较,实现对初步识别结果的修正,提高了相似文本的识别准确率,保证了文本识别结果的可靠性,从而更好的应用于实际场景。
在本发明的实施例介绍中,所涉及的名词及其含义如下:
OCR:Optical Character Recognition文字识别引擎,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;
SVD:Singular Value Decomposition奇异值分解,一种矩阵的分解方法,不仅可以用于降维算法中的特征分解,还可以用于自然语言处理等领域;
BM25算法:一种基于概率检索模型提出的算法,可以用来评价搜索词和文档之间相关性的算法;
TF-IDF算法:Term Frequency–Inverse Document Frequency逆向文件频率,一种用于信息检索与文本挖掘的常用加权技术;
Fuzz.ratio:一种字符串的对比方法。
图1是根据本发明实施例的文本识别方法的主要流程的示意图,如图1所示,本发明实施例的文本识别方法包括如下的步骤S101至步骤S103。
步骤S101、使用文字识别模型对图片进行文字识别处理得到初步识别结果。
具体地,基于现有的文字识别方法,将待识别的图片输入至文字识别模型,通过字符识别方法提取到待识别的图片中的文本集合,得到初步识别结果,此时的初步识别结果可能存在识别错误的字符,如:“研究生”经过文字识别模型提取到的内容为“研究友”,为了提高识别结果的准确率,对初步识别结果进行二次加工和修正,以得到准确率高的识别结果。
步骤S102、将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表。
根据本发明的一个实施例,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:确认所述初步识别结果包括的文本字符个数满足设定要求。
具体地,基于文本识别技术的目的在于通过计算机自动识别图片文本,避免了人工识别再转换为计算机文字的过程,以此来提高业务效率,对于初步识别结果的文本字符个数太少的情况,使用本发明的文本识别意义不大,例如:初步识别结果的文本字符仅有1个,那么再对此1个字符进行加工和修正的意义不大,所以在本发明的一个实施例中,需要在初步识别结果包括的文本字符个数大于1的前提下进行。
根据本发明的另一个实施例,将所述初步识别结果与预设的文本集合列表进行相似度比较包括:将所述初步识别结果以文本行为单位,分别与预设的文本集合列表中的每行文本进行相似度比较。
具体地,对上述基于文字识别模型提取到的初步识别结果以行为单位进行分组,将每组分别与预设的文本集合列表进行循环相似度比较,使用者也可以对上述初步识别结果中的关键文本信息选择性的分组与预设的文本集合列表进行循环相似度比较,得到满足要求的目标文本列表。
根据本发明的再一个实施例,所述满足要求的目标文本列表包括:与所述初步识别结果的文本行完全相同的所述文本集合列表中的文本;与所述初步识别结果的文本行具有文字包含关系的所述文本集合列表中的文本;与所述初步识别结果的文本行的字符相似度满足设定相似度阈值的所述文本集合列表中的文本。
具体地,根据初步识别结果与预设的文本集合列表的相似度比较结果,可以分为三种:与所述初步识别结果的文本行完全相同的所述文本集合列表中的文本;与所述初步识别结果的文本行具有文字包含关系的所述文本集合列表中的文本,例如:初步识别结果为“绿作成功了”,所述文本集合列表中的文本为“操作成功了”;与所述初步识别结果的文本行的字符相似度大于设定相似度阈值的所述文本集合列表中的文本,例如:初步识别结果为“管宾”,所述文本集合列表中的文本为“答案”,此时两个文本的相似度结果大于设定的相似度阈值(例如61.8%),即文本集合列表的“答案”为满足要求的目标文本,在本发明的一个实施例中相似度阈值可以是根据字符形状的黄金分割点设定的。
图2是本发明实施例的文本识别方法的总体流程示意图,待识别图片输入到OCR模型训练,根据OCR文字提取结果,确定初步识别结果为文本字符个数大于1的文本;将初步识别结果以行为单位进行分组,与预设的文本集合列表进行分组循环相似度比较,在初步识别结果与预设的文本集合列表相比较的结果中,如果满足完全相等或者两个集合有包含关系或者相似度大于61.8%,则预设的文本集合列表中的文本满足条件,则可进行后续的修正处理。
根据本发明的又一个实施例,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:将所述初步识别结果划分为:中文字符结果集合、外文字符结果集合和数字结果集合。
具体地,现有的文本识别方法中,对于有中文、外文和数字组合的图片文本,外文和数字识别引起的混淆是文本识别的准确率的主要影响因子,例如:在文本识别中,经常出现数字“0”与字母“o”的混淆识别,为了解决此类问题,对于上述初步识别结果,进行中文、外文和数字的分类划分,即将所述初步识别结果划分为:中文字符结果集合、外文字符结果集合和数字结果集合。在将初步识别结果与预设的文本集合列表进行相似度比较时,即可将中文字符结果集合、外文字符结果集合和数字结果集合,分别与预设的文本集合列表进行相似度比较。
通过将初步识别结果划分为中文、外文和数字结果集合,可以有效避免常规文字识别方法中文字类型混淆的问题,从而提升识别的准确率。
根据本发明的一个实施例,所述文本集合列表是通过对即将使用到的文本集合,以行为单位进行预处理得到的,且所述文本集合列表中的每行文本具有次数属性。
具体地,上述文本集合列表是基于即将使用到的文本集合,以行为单位按照预设的格式进行预处理,每行包括一个文本段信息,格式如下表1所示:
表1
序号 | 标签 | 动作 | 内容 | 内容信息 | 属性 | 属性信息 |
按照上述的格式对即将使用到的文本集合进行预处理,得到文本集合列表。对于此格式,由于初步识别结果中可能存在重复相同的文本内容,而且在最终文本识别后的结果中,对于重复相同的文本,可能有不同的后续操作应用,例如:待识别图片为百度搜索的网页,网页中有多处“百度”字样,对于搜索栏旁边的“百度”搜索按钮,此处的“百度”对应于点击搜索操作,而其它位置的“百度”有语义传达也有链接推送。为了区分图片中重复相同的文本的后续不同的操作应用,上述格式中附带有属性信息,属性信息包括:次数和位置,次数用于标识指定识别的重复相同的文本的序号,另外对于个别的无法通过文本来确定识别位置的可以通过上述格式中属性信息的位置来确定,例如:上述举例的百度搜索栏,由于搜索栏初始内容为空,文本识别无法定位此位置,通过上述格式中的属性信息中的位置信息,可以基于“百度”搜索按钮的次数确定“百度”搜索按钮的位置,再根据格式中属性信息的位置来定位到搜索栏,便于后续非人工操作时自动键入文本内容的识别。
通过对文本集合列表的属性设置,可以更好的区分重复的文本,以便于后续的操作可以正确的执行,进而提升了文本识别的准确率,保证了文本识别后的结果可以直接应用于实际业务系统中。
另外地,对于上述格式,由于每行的文本集合需要包含所有可能的相似文本段,所以每行的内容信息是由多个相似文本段组成,例如,文本集合中的标准文本段对应的文本信息为content1,则与标准文本段相似的文本信息为content2、content3、content4等等。
示例性地,文本集合列表如下表2所示:
表2
上述示例性的文本集合列表用于任务效果分析,对应的后续操作为点击动作,内容信息包括“昨日”和“作日”,“作日”是标准文本“昨日”的相似文本,属性信息中的第一个“0”表示仅需要识别图片文本中第1个与“昨日”或者“作日”相似度高的文本以进行文本替换,“(0、0)”表示不需要进行偏移定位其它位置。
根据本发明的另一个实施例,将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表包括:将所述初步识别结果中的每个文本行分别与预设的文本集合列表进行相似度比较,得到所述每个文本行对应的目标文本;对每个文本行,获取对应的目标文本的次数属性值;对于所述初步识别结果中重复的文本行,若所述文本行的相似度比较次数与对应的目标文本的次数属性值相等,则将所述目标文本作为所述文本行对应的目标文本添加到目标文本列表中;否则,不添加到目标文本列表中。
具体地,由于使用不同的文字识别模型对图片进行文字识别处理得到的结果之间有差异,需要对文字识别结果以行为单位进行统一的兼容规整处理,最终提取文字结果的规整输出如下表3所示:
表3
序号 | 内容 | 位置坐标 | 相似度 |
上述规整输出的内容为行文本段的内容、位置为行位置,相似度为文字识别模型提取时的相似度。
将上述初步识别结果中的每个文本行分别与预设的文本集合列表进行相似度比较,得到满足要求的每个文本行对应的目标文本,其中相似度比较可以使用SVD奇异值分解得到向量来计算相似度、Fuzz.ratio算法、BM25算法、TF-IDF算法等字符比较方法来实现;对每个文本行,获取对应的满足要求的目标文本的次数属性值,此属性值可以根据需要提前进行设置;对于所述初步识别结果中的重复相同文本行,若所述文本行的相似度比较次数与对应的目标文本的次数属性值相等,当然如果上述文本集合列表中的属性信息中的次数值初始为0,相应的上述相似度比较次数减1后与对应的文本集合列表中的目标文本的次数属性值相等,则将所述目标文本作为所述文本行对应的目标文本添加到目标文本列表中;否则此目标文本为非识别对象,不需要添加到目标文本列表中。
根据本发明的再一个实施例,对于所述初步识别结果中的文本行,在未得到与所述文本行对应的目标文本的情况下,将所述文本集合列表中与所述文本行相似度最高的文本按照预设格式进行汇总,并确认是否添加到所述文本集合列表中。
具体地,在未得到与所述文本行对应的目标文本的情况下,将所述文本集合列表中与所述文本行相似度最高的文本按照预设格式进行信息汇总,人工确认是否需要添加到所述文本集合列表中,预设格式如下表4所示:
表4
如果人工确认可以加入文本集合列表,以丰富文本集合列表进一步提高文本识别准确率,则按照上述文本集合列表的格式进行维护,以便后续使用。
步骤S103、根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
具体地,根据所述满足要求的目标文本列表和所述初步识别结果,生成结果文档,其中结果文档包括:标号、文本内容信息和位置坐标信息;根据结果文档进行文本的组装和修正,得到最终的文本识别结果。
图3是本发明实施例的文本识别方法的详细流程示意图,经过OCR文字模型提取后得到OCR文字列表,对文字列表进行中文字符、外文字符和数字字符的划分处理,得到相应的中文字符结果集合、外文字符结果集合和数字结果集合,其中在进行字符的划分处理时,还可以包括:提取和规整处理;以行为单位,分别对中文字符结果集合、外文字符结果集合和数字结果集合使用fuzz.ratio与文本集合列表进行行循环比较,三种类型的比较相似,图中以中文字符结果集合、外文字符结果集合和数字结果集合中的一种为例,对相似比较的过程进行说明,如果找到文本,此中文本为上述满足要求的完全相等、包含关系、相似度>61.8%的任一种,则取文本列表中的属性信息,根据属性信息中的次数值判断是否满足要求,如果满足要求,则将文本信息添加到目标文本列表中;根据结果文档,替换OCR原始文本,重新装文本,更新坐标、标号和内容,完成初步识别结果的修正,得到最终的文本识别结果;如果经过fuzz.ratio的比较没有找到满足要求的文本,则取相似度最高的文本按照预设的格式进行信息汇总,人工确认是否需要放入文本集合列表中。
通过上述文本识别方法,不仅有效区分了中文、外文和数字的识别结果,而且基于字符比较算法对初步识别结果进行二次加工修正,有效保证了文本识别的可靠性和准确率。
图4是根据本发明实施例的文本识别装置的主要模块示意图。如图4所示,文本识别装置400主要包括初步识别结果获取模块401、文本对比模块402和文本修正模块403。
初步识别结果获取模块401,用于使用文字识别模型对图片进行文字识别处理得到初步识别结果;
文本对比模块402,用于将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;
文本修正模块403,用于根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
具体地,文本识别装置400还可以包括识别结果分类模块(图中未示出),用于:在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,将所述初步识别结果划分为:中文字符结果集合、外文字符结果集合和数字结果集合;文本对比模块402还可以用于:将所述中文字符结果集合、外文字符结果集合和数字结果集合,分别与预设的文本集合列表进行相似度比较。
具体地,文本识别装置400还可以包括字符个数判断模块(图中未示出),用于:在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,确认所述初步识别结果包括的文本字符个数满足设定要求。
具体地,文本对比模块402,还可以用于:将所述初步识别结果以文本行为单位,分别与预设的文本集合列表中的每行文本进行相似度比较。
具体地,所述满足要求的目标文本列表包括:与所述初步识别结果的文本行完全相同的所述文本集合列表中的文本;与所述初步识别结果的文本行具有文字包含关系的所述文本集合列表中的文本;与所述初步识别结果的文本行的字符相似度满足设定相似度阈值的所述文本集合列表中的文本。
具体地,所述文本集合列表是通过对即将使用到的文本集合,以行为单位进行预处理得到的,且所述文本集合列表中的每行文本具有次数属性。
具体地,文本对比模块402,还可以用于:将所述初步识别结果中的每个文本行分别与预设的文本集合列表进行相似度比较,得到所述每个文本行对应的目标文本;对每个文本行,获取对应的目标文本的次数属性值;对于所述初步识别结果中重复的文本行,若所述文本行的相似度比较次数与对应的目标文本的次数属性值相等,则将所述目标文本作为所述文本行对应的目标文本添加到目标文本列表中;否则,不添加到目标文本列表中。
具体地,文本对比模块402,还可以用于:对于所述初步识别结果中的文本行,在未得到与所述文本行对应的目标文本的情况下,将所述文本集合列表中与所述文本行相似度最高的文本按照预设格式进行汇总,并确认是否添加到所述文本集合列表中。
图5示出了可以应用本发明实施例的文本识别方法或文本识别装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如文本识别应用、文本扫描应用等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所进行的文本识别提供支持的后台管理服务器(仅为示例)。后台管理服务器可以使用文字识别模型对图片进行文字识别处理得到初步识别结果;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果等处理,并将处理结果(例如文本识别结果等--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的文本识别方法一般由服务器505执行,相应地,文本识别装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统600的结构示意图。图6示出的终端设备或服务器仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是所述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者所述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或所述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者所述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括:初步识别结果获取模块、文本对比模块和文本修正模块。
其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,初步识别结果获取模块还可以被描述为“用于使用文字识别模型对图片进行文字识别处理得到初步识别结果的模块”。
另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是所述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。所述计算机可读介质承载有一个或者多个程序,当所述一个或者多个程序被一个该设备执行时,使得该设备包括:使用文字识别模型对图片进行文字识别处理得到初步识别结果;将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
根据本发明实施例的技术方案,具有如下优点或有益效果:使用文字识别模型对图片进行文字识别处理得到初步识别结果;将初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;根据满足要求的目标文本列表对初步识别结果进行修正,得到最终的文本识别结果的技术方案,实现了将文字识别的初步识别结果与预设的文本集合列表进行相似度比较,以对初步识别结果进行修正,提高了相似文本的识别准确率,保证了文本识别结果的可靠性,从而更好的应用于实际场景。
所述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种文本识别方法,其特征在于,包括:
使用文字识别模型对图片进行文字识别处理得到初步识别结果;
将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;
根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
2.根据权利要求1所述的方法,其特征在于,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:
将所述初步识别结果划分为:中文字符结果集合、外文字符结果集合和数字结果集合;
将所述初步识别结果与预设的文本集合列表进行相似度比较包括:
将所述中文字符结果集合、外文字符结果集合和数字结果集合,分别与预设的文本集合列表进行相似度比较。
3.根据权利要求1所述的方法,其特征在于,在将所述初步识别结果与预设的文本集合列表进行相似度比较之前,还包括:
确认所述初步识别结果包括的文本字符个数满足设定要求。
4.根据权利要求1所述的方法,其特征在于,将所述初步识别结果与预设的文本集合列表进行相似度比较包括:
将所述初步识别结果以文本行为单位,分别与预设的文本集合列表中的每行文本进行相似度比较。
5.根据权利要求4所述的方法,其特征在于,所述满足要求的目标文本列表包括:
与所述初步识别结果的文本行完全相同的所述文本集合列表中的文本;
与所述初步识别结果的文本行具有文字包含关系的所述文本集合列表中的文本;
与所述初步识别结果的文本行的字符相似度满足设定相似度阈值的所述文本集合列表中的文本。
6.根据权利要求1所述的方法,其特征在于,所述文本集合列表是通过对即将使用到的文本集合,以行为单位进行预处理得到的,且所述文本集合列表中的每行文本具有次数属性;
将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表包括:
将所述初步识别结果中的每个文本行分别与预设的文本集合列表进行相似度比较,得到所述每个文本行对应的目标文本;
对每个文本行,获取对应的目标文本的次数属性值;
对于所述初步识别结果中重复的文本行,若所述文本行的相似度比较次数与对应的目标文本的次数属性值相等,则将所述目标文本作为所述文本行对应的目标文本添加到目标文本列表中;否则,不添加到目标文本列表中。
7.根据权利要求6所述的方法,其特征在于,还包括:
对于所述初步识别结果中的文本行,在未得到与所述文本行对应的目标文本的情况下,将所述文本集合列表中与所述文本行相似度最高的文本按照预设格式进行汇总,并确认是否添加到所述文本集合列表中。
8.一种文本识别装置,其特征在于,包括:
初步识别结果获取模块,用于使用文字识别模型对图片进行文字识别处理得到初步识别结果;
文本对比模块,用于将所述初步识别结果与预设的文本集合列表进行相似度比较,得到满足要求的目标文本列表;
文本修正模块,用于根据所述满足要求的目标文本列表对所述初步识别结果进行修正,得到最终的文本识别结果。
9.一种移动电子设备终端,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111466431.3A CN114170451A (zh) | 2021-12-03 | 2021-12-03 | 一种文本识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111466431.3A CN114170451A (zh) | 2021-12-03 | 2021-12-03 | 一种文本识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114170451A true CN114170451A (zh) | 2022-03-11 |
Family
ID=80482807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111466431.3A Pending CN114170451A (zh) | 2021-12-03 | 2021-12-03 | 一种文本识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114170451A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600620A (zh) * | 2022-12-13 | 2023-01-13 | 深圳思谋信息科技有限公司(Cn) | 扫码方法、装置、电子设备和存储介质 |
-
2021
- 2021-12-03 CN CN202111466431.3A patent/CN114170451A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115600620A (zh) * | 2022-12-13 | 2023-01-13 | 深圳思谋信息科技有限公司(Cn) | 扫码方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102171220B1 (ko) | 클레임 서류의 문자 인식 방법, 장치, 서버 및 저장매체 | |
CN110334346B (zh) | 一种pdf文件的信息抽取方法和装置 | |
US9384389B1 (en) | Detecting errors in recognized text | |
CN107330471B (zh) | 反馈内容的问题定位方法和装置、计算机设备、存储介质 | |
CN112396049A (zh) | 文本纠错方法、装置、计算机设备及存储介质 | |
CN106919711B (zh) | 基于人工智能的标注信息的方法和装置 | |
CN113360699B (zh) | 模型训练方法和装置、图像问答方法和装置 | |
US11599727B2 (en) | Intelligent text cleaning method and apparatus, and computer-readable storage medium | |
CN111143505B (zh) | 文档处理方法、装置、介质及电子设备 | |
CN110781284A (zh) | 基于知识图谱的问答方法、装置和存储介质 | |
CN111104479A (zh) | 一种数据标注的方法及装置 | |
CN111143556A (zh) | 软件功能点自动计数方法、装置、介质及电子设备 | |
CN114170451A (zh) | 一种文本识别方法和装置 | |
CN111881900B (zh) | 语料生成、翻译模型训练、翻译方法、装置、设备及介质 | |
CN112528610A (zh) | 一种数据标注方法、装置、电子设备及存储介质 | |
CN111581937A (zh) | 文档生成方法、装置、计算机可读介质及电子设备 | |
CN116860747A (zh) | 训练样本的生成方法、装置、电子设备及存储介质 | |
CN111368693A (zh) | 一种身份证信息的识别方法和装置 | |
CN115294593A (zh) | 一种图像信息抽取方法、装置、计算机设备及存储介质 | |
US11341760B2 (en) | Form processing and analysis system | |
CN114049686A (zh) | 签名识别模型训练方法、装置及电子设备 | |
CN114691850A (zh) | 生成问答对的方法、神经网络模型的训练方法和装置 | |
CN114298845A (zh) | 一种理赔票据处理方法和装置 | |
CN112801086A (zh) | 凭证分类的方法、装置、电子设备和存储介质 | |
CN114373068A (zh) | 一种行业场景化的ocr模型实现系统、方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |