CN109344836B - 一种文字识别方法和设备 - Google Patents

一种文字识别方法和设备 Download PDF

Info

Publication number
CN109344836B
CN109344836B CN201811160588.1A CN201811160588A CN109344836B CN 109344836 B CN109344836 B CN 109344836B CN 201811160588 A CN201811160588 A CN 201811160588A CN 109344836 B CN109344836 B CN 109344836B
Authority
CN
China
Prior art keywords
images
recognition
image
character
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811160588.1A
Other languages
English (en)
Other versions
CN109344836A (zh
Inventor
王依文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kingdee Software China Co Ltd
Original Assignee
Kingdee Software China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingdee Software China Co Ltd filed Critical Kingdee Software China Co Ltd
Priority to CN201811160588.1A priority Critical patent/CN109344836B/zh
Publication of CN109344836A publication Critical patent/CN109344836A/zh
Application granted granted Critical
Publication of CN109344836B publication Critical patent/CN109344836B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本申请公开了一种文字识别方法,包括:获取文字图像;对该文字图像进行图像预处理得到多类待识别图像,该多类待识别图像是该文字图像经过多种不同方式的图像处理得到的图像;对该多类待识别图像进行字符识别得到对应的多组识别数据;对该多组识别数据进行分析得到识别结果。本申请实施例还提供相应的文字识别设备。本申请技术方案由于在进行图像文字识别前,对文字图像进行多种不同方式的图像处理得到多种不同类型的图像用于进行文字识别,并得到多组识别数据,对这些识别数据进行概率统计分析,选出识别概率最高的字符数据用作识别结果,可以提高文字识别的准确率。

Description

一种文字识别方法和设备
技术领域
本申请涉及文字识别技术领域,具体涉及一种文字识别方法和设备。
背景技术
随着图像技术的发展和市场需求的逐渐扩大,图像文字识别技术逐渐成熟,光学字符识别(optical character recognition,OCR)就是图像文字识别技术中的一种。根据OCR技术可以开发出OCR引擎。OCR引擎是指将OCR核心技术整理成软件开发包(softwaredevelopment kit,SDK)的形式,供各种应用程序调用OCR核心技术,开发各种OCR应用软件,如文档识别、名片识别、证件识别、车牌识别和移动端识别应用等。
在识别图像文字的时候,通常通过扫描或者图像传感器获取待识别的文字图像,获取文字图像后,调用OCR引擎对文字图像上的数据进行识别并输出结构化的图像数据,其后,程序可以根据指令对输出的结构化的图像数据进行处理,然后给出识别结果。
在现有技术中,通过扫描或者图像传感器获取的文字图像由于亮度、对比度、变形率、图像噪声等因素的影响,图像质量较低,导致OCR引擎识别难度增大,产生识别错误,降低识别准确率。
发明内容
本申请实施例提供一种文字识别方法,在进行图像文字识别时,可以对文字图像进行图像预处理,得到多种不同类型的图像用于进行文字识别,根据多种图像进行文字识别可以得到多组识别数据,对这些识别数据进行概率统计分析,可以选择出识别概率最大的字符数据作为识别结果,可以降低识别错误发生率,提高识别准确率。
为达到上述目的,本申请实施例提供如下技术方案:
本申请第一方面提供一种文字识别方法,该方法可以包括:获取文字图像,获取方式可以是扫描,也可以是通过图像传感器获取;对获取的文字图像进行图像预处理得到多类待识别图像用于进行字符识别,该多类待识别图像是该文字图像经过多种不同方式的图像处理得到的图像;对该多类待识别图像分别进行字符识别得到对应的多组识别数据,字符识别的方法可以是调用OCR引擎进行识别;对该多组识别数据进行概率统计分析得到最后的识别结果。由上述第一方面可知,本方案可以在进行图像文字识别时,对文字图像进行预处理得到多类待识别图像用于进行文字识别,并得到多组识别数据,对这些多组识别数据进行分析,选出最优的识别结果,可以有效降低识别错误发生率,提高识别准确率。
可选地,结合上述第一方面,在第一种可能的实现方式中,该多类待识别图像可以包括反色处理图像、放大处理图像、灰度处理图像、黑白处理图像或降噪处理图像中的至少两项。该第一方面第一种可能的实现方式,提供了多种可用于进行文字识别的待识别图像,增加方案实施的多样性。
可选地,结合上述第一方面第一种可能的实现方式,在第二种可能的实现方式中,对文字图像进行图像预处理得到多类待识别图像,可以包括:当该多类待识别图像中需要包含反色处理图像时,对该文字图像进行反色处理得到该反色处理图像;当该多类待识别图像中需要包含放大处理图像时,对该文字图像进行放大处理得到该放大处理图像;当该多类待识别图像中需要包含灰度处理图像时,对该文字图像进行灰度处理得到该灰度处理图像;当该多类待识别图像中需要包含黑白处理图像时,对该文字图像进行黑白处理得到该黑白处理图像;当该多类待识别图像中需要包含降噪处理图像时,对该文字图像进行降噪处理得到该降噪处理图像。该第一方面第二种可能的实现方式,提供了多种获取多类待识别图像的方法。
可选地,结合上述第一方面第二种可能的实现方式,在第三种可能的实现方式中,该多组识别数据包括第一识别数据、第二识别数据、第三识别数据、第四识别数据或第五识别数据中的至少两项。该第一方面第三种可能的实现方式中,每一组识别数据分别对应上述每一类待识别图像。
可选地,结合上述第一方面第二种可能的实现方式,在第四种可能的实现方式中,字符识别的方法可以是OCR识别,对该多类待识别图像进行字符识别得到对应的多组识别数据,可以包括:当该多类待识别图像包含反色处理图像时,通过OCR引擎对该反色处理图像进行识别得到第一识别数据;当该多类待识别图像包含放大处理图像时,通过OCR引擎对该放大处理图像进行识别得到第二识别数据;当该多类待识别图像包含灰度处理图像时,通过OCR引擎对该灰度处理图像进行识别得到第三识别数据;当该多类待识别图像包含黑白处理图像时,通过OCR引擎对该黑白处理图像进行识别得到第四识别数据;当该多类待识别图像包含降噪处理图像时,通过OCR引擎对该降噪处理图像进行识别得到第五识别数据。该第一方面第四种可能的实现方式,提供了获取多组识别数据的方法。
可选地,结合上述第一方面、第一方面第一种至第四种中任意一种可能的实现方式,在第五种可能的实现方式中,对多组识别数据进行分析得到识别结果,可以包括:对多组识别数据中每一组识别数据在文字图像的相同位置上对应的字符数据进行概率统计分析,选择识别概率最高的字符数据作为识别结果。该第一方面第五种可能的实现方式,通过对多组识别数据进行概率统计分析,选出识别概率最高的字符数据作为识别结果,可以降低识别错误发生率,提高识别准确率。
本申请第二方面提供一种文字识别设备,该文字识别设备具有实现上述第一方面或第一方面任意一种可能实现方式的方法的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。
本申请第三方面提供一种文字识别设备,该文字识别设备包括:输入/输出(I/O)接口、处理器和存储器;该存储器用于存储计算机执行指令,当该文字识别设备运行时,该处理器执行该存储器存储的计算机执行指令,以使该文字识别设备执行如上述第一方面或第一方面任意一种可能实现方式的文字识别方法。
本申请第四方面提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机可以执行上述第一方面或第一方面任意一种可能实现方式的文字识别方法。
本申请第五方面提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机可以执行上述第一方面或第一方面任意一种可能实现方式的文字识别方法。
本申请第六方面提供一种芯片系统,该芯片系统包括处理器,用于支持该文字识别设备实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中,芯片系统还包括存储器,该存储器用于保存该文字识别设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
其中,第二方面、第三方面、第四方面、第五方面、第六方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
本申请实施例提供了一种文字识别方法和设备,在进行文字识别时,可以对文字图像进行多种不同方式的图像处理,得到多种不同类型的待识别图像用于进行文字识别,根据多种待识别图像进行文字识别可以得到多组识别数据,对这些识别数据进行概率统计分析,选择出识别概率最大的字符数据作为识别结果,可以降低识别错误发生率,提高识别准确率。
附图说明
图1是OCR识别流程图;
图2是本申请方案中文字识别流程图;
图3是本申请实施例中文字识别方法一个实施例示意图;
图4是本申请实施例中文字识别方法另一实施例示意图;
图5是本申请实施例中文字识别方法另一实施例示意图;
图6是本申请实施例中文字识别设备一个实施例示意图;
图7是本申请实施例中文字识别设备另一实施例示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。本领域普通技术人员可知,随着图计算框架的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供了一种文字识别方法和设备,在进行文字识别时,可以对文字图像进行多种不同方式的图像处理,得到多种不同类型的待识别图像用于进行文字识别,根据多种待识别图像进行文字识别可以得到多组识别数据,对这些识别数据进行概率统计分析,选择出识别概率最大的字符数据作为识别结果,可以降低识别错误发生率,提高识别准确率。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号,并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤,已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序,只要能达到相同或者相类似的技术效果即可。本申请中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
图1是OCR识别流程图。
如图1所示,在现有技术中,获取文字图像后,直接通过OCR引擎对文字图像进行OCR识别,得出识别数据,并根据识别数据得到识别结果。这种方法中,通过扫描或者图像传感器获取的文字图像由于亮度、对比度、变形率、图像噪声等因素的影响,图像质量较低,导致OCR引擎识别难度增大,产生识别错误,降低识别准确率。
图2是本申请方案中文字识别流程图。
如图2所示,在本申请方案中,获取文字图像后,先对文字图像进行处理,获取多种经过不同图像处理方式后的文字图像作为待识别图像,这些待识别图像包括:反色处理图像、放大处理图像、灰度处理图像、黑白处理图像以及其他图像,然后再对每种待识别图像进行OCR识别,得到一一对应的多组识别数据,再对这些识别数据进行概率统计分析,选取识别概率最大的字符数据作为识别结果。这种方法可以有效降低识别错误发生率,提高识别准确率。
可以理解的是,本申请方案中待识别图像还可以包括更多种类型,获取这些待识别图像的方式也可以包括更多种图像处理方式,根据这些待识别图像得到的识别数据的组数也可以相应的改变,具体此处不作限定。
图3是本申请实施例中文字识别方法一个实施例示意图。
如图3所示,本申请实施例中文字识别方法一个实施例包括:
301、获取文字图像。
在本实施例中,获取文字图像的方式可以是通过扫描获取或通过图像传感器获取。
302、对文字图像进行图像预处理得到多类待识别图像。
在本实施例中,可以对文字图像进行多种不同方式的图像处理,得到多种不同类型的图像作为待识别图像。
303、对多类待识别图像进行字符识别得到对应的多组识别数据。
在本实施例中,对多类待识别图像进行字符识别可以得到分别与多类待识别图像一一对应的多组识别数据。
304、对多组识别数据进行分析得到识别结果。
在本实施例中,识别数据有多组,通过对这些不同组别的识别数据进行分析,可以得出最优的识别结果。
由于本申请方案对文字图像的图像预处理过程可能包含多种图像处理方式,所以存在多种不同的情况,以下选取两种不同情况作为示例进行说明:
一、图像预处理过程包含三种图像处理方式。
图4是本申请实施例中文字识别方法另一实施例示意图。
如图4所示,本申请实施例中文字识别方法另一实施例包括:
401、获取文字图像。
在本实施例中,步骤401与上述步骤301相同。
402、对文字图像进行反色处理得到反色处理图像。
在本实施例中,经过反色处理得到的反色处理图像作为第一类待识别图像。
403、对文字图像进行放大处理得到放大处理图像。
在本实施例中,经过放大处理得到的放大处理图像作为第二类待识别图像。
404、对文字图像进行灰度处理得到灰度处理图像。
在本实施例中,经过灰度处理得到的灰度处理图像作为第三类待识别图像。
需要说明的是,本申请对步骤402至步骤404之间的先后顺序不做限定。
405、对反色处理图像进行OCR识别得到第一识别数据。
在本实施例中,对待识别图像的字符识别方式为OCR识别,通过调用OCR引擎对反色处理图像进行识别可得到第一识别数据。
406、对放大处理图像进行OCR识别得到第二识别数据。
在本实施例中,通过调用OCR引擎对放大处理图像进行识别可得到第二识别数据。
407、对灰度处理图像进行OCR识别得到第三识别数据。
在本实施例中,通过调用OCR引擎对灰度处理图像进行识别可得到第三识别数据。
需要说明的是,本申请对步骤405至步骤407之间的先后顺序不做限定。
408、对第一识别数据、第二识别数据和第三识别数据进行概率统计分析,得到识别概率最大的字符数据作为识别结果。
在本实施例中,第一识别数据、第二识别数据和第三识别数据对应文字图像每个相同文字位置上均有字符数据,通过对这些字符数据进行概率统计分析,可以选出每个文字位置上识别概率最大的字符数据生成识别结果。
可以理解的是,本申请引入概率统计分析概念后,在具体实施过程中,待识别图像的类型数量为奇数的情况下,识别结果可能更加准确。
二、图像预处理过程包含五种图像处理方式。
图5是本申请实施例中文字识别方法另一实施例示意图。
如图5所示,本申请实施例中文字识别方法另一实施例包括:
501、获取文字图像。
在本实施例中,步骤501与上述步骤301以及步骤401均相同。
502、对文字图像进行反色处理得到反色处理图像。
在本实施例中,经过反色处理得到的反色处理图像作为第一类待识别图像。
503、对文字图像进行放大处理得到放大处理图像。
在本实施例中,经过放大处理得到的放大处理图像作为第二类待识别图像。
504、对文字图像进行灰度处理得到灰度处理图像。
在本实施例中,经过灰度处理得到的灰度处理图像作为第三类待识别图像。
505、对文字图像进行黑白处理得到黑白处理图像。
在本实施例中,经过黑白处理得到的黑白处理图像作为第四类待识别图像。
506、对文字图像进行降噪处理得到降噪处理图像。
在本实施例中,经过降噪处理得到的降噪处理图像作为第五类待识别图像。
需要说明的是,本申请对步骤502至步骤506之间的先后顺序不做限定。
507、对反色处理图像进行OCR识别得到第一识别数据。
在本实施例中,对待识别图像的字符识别方式为OCR识别,通过调用OCR引擎对反色处理图像进行识别可得到第一识别数据。
508、对放大处理图像进行OCR识别得到第二识别数据。
在本实施例中,通过调用OCR引擎对放大处理图像进行识别可得到第二识别数据。
509、对灰度处理图像进行OCR识别得到第三识别数据。
在本实施例中,通过调用OCR引擎对灰度处理图像进行识别可得到第三识别数据。
5010、对黑白处理图像进行OCR识别得到第四识别数据。
在本实施例中,通过调用OCR引擎对黑白处理图像进行识别可得到第四识别数据。
5011、对降噪处理图像进行OCR识别得到第五识别数据。
在本实施例中,通过调用OCR引擎对降噪处理图像进行识别可得到第五识别数据。
需要说明的是,本申请对步骤507至步骤5011之间的先后顺序不做限定。
5012、对第一识别数据、第二识别数据、第三识别数据、第四识别数据和第五识别数据进行概率统计分析,得到识别概率最大的字符数据作为识别结果。
在本实施例中,第一识别数据、第二识别数据、第三识别数据、第四识别数据和第五识别数据对应文字图像每个相同文字位置上均有字符数据,通过对这些字符数据进行概率统计分析,可以选出每个文字位置上识别概率最大的字符数据生成识别结果。
上面对本申请实施例中的文字识别方法进行了描述,下面对本申请实施例中的文字识别设备进行描述。
图6是本申请实施例中文字识别设备一个实施例示意图。
如图6所示,本申请实施例中文字识别设备60的一个实施例包括:
获取单元601,用于获取文字图像;
处理单元602,用于获取单元601获取文字图像后,对该文字图像进行图像预处理得到多类待识别图像;
识别单元603,用于处理单元602对该文字图像进行图像预处理得到多类待识别图像后,对该多类待识别图像进行字符识别得到对应的多组识别数据;
分析单元604,用于识别单元603对该多类待识别图像进行字符识别得到对应的多组识别数据后,对该多组识别数据进行分析得到识别结果。
在本实施例中,处理单元602可以进一步包括:
第一处理模块6021,用于当该多类待识别图像需包含反色处理图像时,对获取单元601获取的文字图像进行反色处理得到该反色处理图像;
第二处理模块6022,用于当该多类待识别图像需包含放大处理图像时,对获取单元601获取的文字图像进行放大处理得到该放大处理图像;
第三处理模块6023,用于当该多类待识别图像需包含灰度处理图像时,对获取单元601获取的文字图像进行灰度处理得到该灰度处理图像;
第四处理模块6024,用于当该多类待识别图像需包含黑白处理图像时,对获取单元601获取的文字图像进行黑白处理得到该黑白处理图像;
第五处理模块6025,用于当该多类待识别图像需包含降噪处理图像时,对获取单元601获取的文字图像进行降噪处理得到该降噪处理图像。
在本实施例中,识别单元603可以进一步包括:
第一识别模块6031,用于第一处理模块6021对该文字图像进行反色处理得到反色处理图像后,通过OCR引擎对该反色处理图像进行识别得到第一识别数据;
第二识别模块6032,用于第二处理模块6022对该文字图像进行放大处理得到放大处理图像后,通过OCR引擎对该放大处理图像进行识别得到第二识别数据;
第三识别模块6033,用于第三处理模块6023对该文字图像进行灰度处理得到灰度处理图像后,通过OCR引擎对该灰度处理图像进行识别得到第三识别数据;
第四识别模块6034,用于第四处理模块6024对该文字图像进行黑白处理得到黑白处理图像后,通过OCR引擎对该黑白处理图像进行识别得到第四识别数据;
第五识别模块6035,用于第五处理模块6025对该文字图像进行降噪处理得到降噪处理图像后,通过OCR引擎对该降噪处理图像进行识别得到第五识别数据。
在本实施例中,分析单元604可以包括:
分析模块6041,用于对识别单元603得到的多组识别数据在文字图像中的相同位置上对应的字符数据进行概率统计分析,得到识别概率最高的字符数据作为识别结果。
图7是本申请实施例中文字识别设备另一实施例示意图。
如图7所示,本申请实施例中文字识别设备70的另一实施例包括:
输入接口701、输出接口702、处理器703和存储器704。在本申请的一些实施例中,输入装置701、输出装置702、处理器703和存储器704可通过总线或其它方式连接,其中,图7中以通过总线连接为例。
其中,通过调用存储器704存储的操作指令,处理器703,用于执行本申请实施例中文字识别设备执行的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本申请实施例所提供的文字识别方法以及文字识别设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种文字识别方法,其特征在于,包括:
获取文字图像;
对所述文字图像进行图像预处理得到多类待识别图像,所述多类待识别图像是所述文字图像经过多种不同方式的图像处理得到的图像;
对所述多类待识别图像进行字符识别得到对应的多组识别数据;
对所述多组识别数据进行分析得到识别结果;
所述多类待识别图像包括反色处理图像、放大处理图像、灰度处理图像、黑白处理图像或降噪处理图像中的至少两项;
所述对所述多组识别数据进行分析得到识别结果,包括:
对所述多组识别数据在所述文字图像中的相同位置上对应的字符数据进行概率统计分析,得到识别概率最高的字符数据作为所述识别结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述文字图像进行图像预处理得到多类待识别图像,包括:
当所述多类待识别图像包括所述反色处理图像时,对所述文字图像进行反色处理得到所述反色处理图像;
当所述多类待识别图像包括所述放大处理图像时,对所述文字图像进行放大处理得到所述放大处理图像;
当所述多类待识别图像包括所述灰度处理图像时,对所述文字图像进行灰度处理得到所述灰度处理图像;
当所述多类待识别图像包括所述黑白处理图像时,对所述文字图像进行黑白处理得到所述黑白处理图像;
当所述多类待识别图像包括所述降噪处理图像时,对所述文字图像进行降噪处理得到所述降噪处理图像。
3.根据权利要求2所述的方法,其特征在于,所述多组识别数据包括第一识别数据、第二识别数据、第三识别数据、第四识别数据或第五识别数据中的至少两项。
4.根据权利要求3所述的方法,其特征在于,所述字符识别为光学字符识别OCR,所述对所述多类待识别图像进行字符识别得到对应的多组识别数据,包括:
当所述多类待识别图像包括所述反色处理图像时,通过OCR引擎对所述反色处理图像进行识别得到所述第一识别数据;
当所述多类待识别图像包括所述放大处理图像时,通过OCR引擎对所述放大处理图像进行识别得到所述第二识别数据;
当所述多类待识别图像包括所述灰度处理图像时,通过OCR引擎对所述灰度处理图像进行识别得到所述第三识别数据;
当所述多类待识别图像包括所述黑白处理图像时,通过OCR引擎对所述黑白处理图像进行识别得到所述第四识别数据;
当所述多类待识别图像包括所述降噪处理图像时,通过OCR引擎对所述降噪处理图像进行识别得到所述第五识别数据。
5.一种文字识别设备,其特征在于,包括:
获取单元,用于获取文字图像;
处理单元,用于所述获取单元获取所述文字图像后,对所述文字图像进行图像预处理得到多类待识别图像;
识别单元,用于所述处理单元对所述文字图像进行图像预处理得到所述多类待识别图像后,对所述多类待识别图像进行字符识别得到对应的多组识别数据;
分析单元,用于所述识别单元对所述多类待识别图像进行字符识别得到对应的所述多组识别数据后,对所述多组识别数据进行分析得到识别结果;
所述多类待识别图像包括:反色处理图像、放大处理图像、灰度处理图像、黑白处理图像或降噪处理图像中的至少两项;
所述分析单元包括:
分析模块,用于对所述多组识别数据在所述文字图像中的相同位置上对应的字符数据进行概率统计分析,得到识别概率最高的字符数据作为所述识别结果。
6.根据权利要求5所述的文字识别设备,其特征在于,所述多组识别数据包括第一识别数据、第二识别数据、第三识别数据、第四识别数据或第五识别数据中的至少两项;
所述识别单元包括:
第一识别模块,用于第一处理模块对所述文字图像进行反色处理得到所述反色处理图像后,通过OCR引擎对所述反色处理图像进行识别得到第一识别数据;
第二识别模块,用于第二处理模块对所述文字图像进行放大处理得到所述放大处理图像后,通过OCR引擎对所述放大处理图像进行识别得到第二识别数据;
第三识别模块,用于第三处理模块对所述文字图像进行灰度处理得到所述灰度处理图像后,通过OCR引擎对所述灰度处理图像进行识别得到第三识别数据;
第四识别模块,用于第四处理模块对所述文字图像进行黑白处理得到所述黑白处理图像后,通过OCR引擎对所述黑白处理图像进行识别得到第四识别数据;
第五识别模块,用于第五处理模块对所述文字图像进行降噪处理得到所述降噪处理图像后,通过OCR引擎对所述降噪处理图像进行识别得到第五识别数据。
7.一种文字识别设备,其特征在于,所述文字识别设备包括:
处理单元和存储单元,
所述存储单元,用于存储计算机操作指令;
所述处理单元,用于调用所述计算机操作指令,以执行如权利要求1-4任一项所述的文字识别方法。
8.一种计算机可读存储介质,其特征在于,包括计算机操作指令,当所述计算机操作指令在计算机上运行时,使得所述计算机执行如权利要求1-4任一项所述的文字识别方法。
CN201811160588.1A 2018-09-30 2018-09-30 一种文字识别方法和设备 Active CN109344836B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811160588.1A CN109344836B (zh) 2018-09-30 2018-09-30 一种文字识别方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811160588.1A CN109344836B (zh) 2018-09-30 2018-09-30 一种文字识别方法和设备

Publications (2)

Publication Number Publication Date
CN109344836A CN109344836A (zh) 2019-02-15
CN109344836B true CN109344836B (zh) 2021-05-14

Family

ID=65307724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811160588.1A Active CN109344836B (zh) 2018-09-30 2018-09-30 一种文字识别方法和设备

Country Status (1)

Country Link
CN (1) CN109344836B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128494A (zh) * 2019-12-30 2021-07-16 华为技术有限公司 识别图像中文本的方法、装置和系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6799302B1 (en) * 2000-09-19 2004-09-28 Adobe Systems Incorporated Low-fidelity document rendering
CN1848137A (zh) * 2005-04-13 2006-10-18 佳能株式会社 增强字符行图像的方法、设备和存储介质
US8761511B2 (en) * 2009-09-30 2014-06-24 F. Scott Deaver Preprocessing of grayscale images for optical character recognition
CN104268814A (zh) * 2014-10-11 2015-01-07 北京网秦天下科技有限公司 生成电子病历的方法和装置
CN104463195A (zh) * 2014-11-08 2015-03-25 沈阳工业大学 基于模板匹配的印刷体数字识别方法
CN106216279A (zh) * 2016-08-03 2016-12-14 南京键通电子商务有限公司 一种密码覆膜卡刮卡及信息识别系统
CN107016363A (zh) * 2017-03-30 2017-08-04 理光图像技术(上海)有限公司 票据图像管理装置、票据图像管理系统以及方法
CN107220640A (zh) * 2017-05-23 2017-09-29 广州绿怡信息科技有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
CN108345880A (zh) * 2018-01-26 2018-07-31 金蝶软件(中国)有限公司 发票识别方法、装置、计算机设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110182471A1 (en) * 2009-11-30 2011-07-28 Abisee, Inc. Handling information flow in printed text processing

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6799302B1 (en) * 2000-09-19 2004-09-28 Adobe Systems Incorporated Low-fidelity document rendering
CN1848137A (zh) * 2005-04-13 2006-10-18 佳能株式会社 增强字符行图像的方法、设备和存储介质
US8761511B2 (en) * 2009-09-30 2014-06-24 F. Scott Deaver Preprocessing of grayscale images for optical character recognition
CN104268814A (zh) * 2014-10-11 2015-01-07 北京网秦天下科技有限公司 生成电子病历的方法和装置
CN104463195A (zh) * 2014-11-08 2015-03-25 沈阳工业大学 基于模板匹配的印刷体数字识别方法
CN106216279A (zh) * 2016-08-03 2016-12-14 南京键通电子商务有限公司 一种密码覆膜卡刮卡及信息识别系统
CN107016363A (zh) * 2017-03-30 2017-08-04 理光图像技术(上海)有限公司 票据图像管理装置、票据图像管理系统以及方法
CN107220640A (zh) * 2017-05-23 2017-09-29 广州绿怡信息科技有限公司 字符识别方法、装置、计算机设备和计算机可读存储介质
CN108345880A (zh) * 2018-01-26 2018-07-31 金蝶软件(中国)有限公司 发票识别方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An OCR-Independent Character Segmentation Using Shortest-Path in Grayscale Document Images;Jia Tse等;《Sixth International Conference on Machine Learning and Applications》;20071231;第142-147页 *
车牌自动识别系统;何斌;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20080815(第08期);第I138-598页 *

Also Published As

Publication number Publication date
CN109344836A (zh) 2019-02-15

Similar Documents

Publication Publication Date Title
CN110135411B (zh) 名片识别方法和装置
CN111369545B (zh) 边缘缺陷检测方法、装置、模型、设备及可读存储介质
CN108256591B (zh) 用于输出信息的方法和装置
CN109741517A (zh) 一种发票查验方法、装置和系统
CN109684008B (zh) 卡片渲染方法、装置、终端及计算机可读存储介质
CN110705651A (zh) 用于对视频识别准确率测试的方法、装置、设备及介质
CN109598271B (zh) 一种字符分割方法及装置
US10261849B1 (en) Preventative remediation of services
JP2020170495A (ja) 単一画素攻撃サンプルの生成方法、装置、設備及び記憶媒体
CN111950557A (zh) 错题处理方法、图像形成装置及电子设备
CN111144402A (zh) Ocr识别准确率的计算方法、装置、设备以及存储介质
CN112364744A (zh) 基于TensorRT加速深度学习图像识别的方法、装置及介质
CN109344836B (zh) 一种文字识别方法和设备
CN108268778B (zh) 数据处理方法、装置及存储介质
CN110826619A (zh) 电子卷宗的文件分类方法、装置及电子设备
CN113762312A (zh) 页面的埋点分析方法和装置
CN110119459A (zh) 图像数据检索方法及图像数据检索装置
CN115273123B (zh) 一种票据识别方法、装置、设备及计算机存储介质
CN111626313B (zh) 一种特征提取模型训练方法、图像处理方法及装置
CN112149678A (zh) 特殊语言的文字识别方法、识别模型训练方法和装置
CN115620039B (zh) 一种图像标注方法、装置、设备和介质
CN108629219B (zh) 一种识别一维码的方法及装置
US20220058530A1 (en) Method and device for optimizing deep learning model conversion, and storage medium
CN113190437B (zh) 无线模组的时序分析方法、装置、计算机设备和存储介质
CN110245668B (zh) 基于图像识别的终端信息获取方法、获取装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant