CN111783066A - 文字识别方法、系统、计算机设备及存储介质 - Google Patents
文字识别方法、系统、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN111783066A CN111783066A CN202010647824.3A CN202010647824A CN111783066A CN 111783066 A CN111783066 A CN 111783066A CN 202010647824 A CN202010647824 A CN 202010647824A CN 111783066 A CN111783066 A CN 111783066A
- Authority
- CN
- China
- Prior art keywords
- character
- picture
- recognized
- identified
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012795 verification Methods 0.000 claims abstract description 53
- 238000012790 confirmation Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 230000003930 cognitive ability Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 5
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/36—User authentication by graphic or iconic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2133—Verifying human interaction, e.g., Captcha
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本公开实施例提供一种文字识别方法、系统、计算机设备及存储介质,其中,所述方法包括:接收需求方发送的各幅待识别文字图片;将每幅待识别文字图片分别分发给多个使用验证码系统的第三方系统,以使各个第三方系统将其用户识别出并手动输入的与待识别文字图片对应的可编辑文字发送给验证码系统;按照预设规则对各个第三方系统发送的每幅待识别文字图片对应的可编辑文字进行处理,以得出每幅待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给需求方。本公开实施例通过验证码系统将待识别文字图片分发给多个第三方系统,利用各个第三方系统用户的认知能力来正确识别待识别文字图片中的模糊文字,提高了纸质文字电子化的准确率。
Description
技术领域
本公开涉及通信技术领域,尤其涉及一种文字识别方法、一种文字识别系统、一种计算机设备以及一种计算机可读存储介质。
背景技术
图书是文化载体的表现形式,它的产生和发展都有一定的基本规律,以电子书为代表的新一代读物的出现和普及,给传统的纸质图书带来巨大的冲击。纸质书在深度阅读、传承文明、出版正规等方面都有优势;而电子书具有方便快捷、易于携带、便宜、内容丰富、环保、人性化等优点,但同时,电子书在阅读习惯限制、阅读设备局限、出版混乱等方面也存在一些缺陷。从多个层面来说,电子书和纸质书能够互补,在现阶段到未来相当长的一段时间内,二者还将共存。
将现存纸质图书电子化是图书留存的方式之一。目前,将纸质图书电子化一般采用如下几种途径:
1、直接将纸质图书扫描成PDF文档,一般不可编辑。
2、用精度稍高的扫描仪对纸质图书进行扫描后,再用文字识别软件识别出来整理成可编辑的文档。
可见,现有技术中将纸质图书识别为可编辑的电子文档一般是通过文字识别软件来实现,但是,当存在纸张褶皱、文字粘污等情况时,文字识别软件就会识别不准确,从而降低用户阅读效果,甚至可能会影响到用户的正常工作。
因此,提出一种结果更为准确的文字识别方案是目前亟待解决的问题。
发明内容
为了至少部分解决现有技术中存在的技术问题而完成了本公开。
根据本公开实施例的一方面,提供一种文字识别方法,应用于验证码系统,所述方法包括:
接收需求方发送的各幅待识别文字图片;
将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;以及,
按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
根据本公开实施例的另一方面,提供一种文字识别系统,其包括验证码系统,所述验证码系统包括:
接收模块,其设置为接收需求方发送的各幅待识别文字图片;
分发模块,其设置为将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;以及,
处理模块,其设置为按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
根据本公开实施例的又一方面,提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行前述文字识别方法。
根据本公开实施例的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行前述文字识别方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开实施例提供的文字识别方法,通过验证码系统将待识别文字图片分发给使用所述验证码系统的多个第三方系统,集思广益,充分发挥各个第三方系统用户的主观能动性,利用各个第三方系统用户的认知能力来正确识别待识别文字图片中的模糊文字,从而提高纸质文字电子化的准确率。
本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本公开技术方案的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开的技术方案,并不构成对本公开技术方案的限制。
图1为本公开实施例提供的一种文字识别方法的流程示意图;
图2为本公开实施例提供的另一种文字识别方法的流程示意图;
图3为本公开实施例提供的一种文字识别系统的结构示意图;
图4为本公开实施例提供的另一种文字识别系统的结构示意图;
图5为本公开实施例提供的计算机设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序;并且,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互任意组合。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本公开的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
图1为本公开实施例提供的一种文字识别方法的流程示意图。所述文字识别方法应用于验证码系统,如图1所示,所述方法包括如下步骤S101至S103。
S101.接收需求方发送的各幅待识别文字图片;
S102.将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;
S103.按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
其中,待识别文字图片可以为需求方需要验证的纸质文字(即易产生识别错误的纸质文字)扫描或拍摄而成的文字图片。该纸质文字可以是有残缺的、污损的、不清晰的。每幅待识别文字图片中可能有几个文字、几行文字或一页文字,本公开对此不作限定。
第三方系统收到待识别文字图片后,将该待识别文字图片作为验证码图片推送给用户,即第三方系统用户识别验证码时显示的是该待识别文字图片,用户从该待识别文字图片中识别出文字后需要手动输入以形成与该述待识别文字图片对应的可编辑文字,再通过第三方系统反馈给验证码系统。
本公开实施例中,通过验证码系统将待识别文字图片分发给使用所述验证码系统的多个第三方系统,集思广益,充分发挥各个第三方系统用户的主观能动性,利用各个第三方系统用户的认知能力来正确识别待识别文字图片中的模糊文字,从而提高纸质文字电子化的准确率。
在一种实施方式中,步骤S103具体包括如下步骤S103-1至S103-4。
S103-1.分别对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行统计;
S103-2.针对每幅所述待识别文字图片中的每个文字,判断是否超过预设数量的第三方系统用户识别为同一个字;
S103-3.若超过预设数量的第三方系统用户识别为同一个字,则将该字确认为该幅待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字;
S103-4.将每幅所述待识别文字图片分别对应的所有确认文字形成为可编辑文档并发送给所述需求方。
本公开实施例中,该预设数量可以为所有第三方系统用户的一半数量,即针对该幅待识别文字图片中的每个文字,超过半数的第三方系统用户识别为同一个字时,将该字确认为该幅待识别文字图片中的相应文字;该预设数量也可以为一个具体的设定值,例如20,即针对该幅待识别文字图片中的每个文字,超过20位第三方系统用户识别为同一个字时,将该字确认为该幅待识别文字图片中的相应文字。
在一种实施方式中,步骤S103还包括如下步骤S103-5至S103-9。
S103-5.若没有超过预设数量的第三方系统用户识别为同一个字,则对于该幅待识别文字图片中的该文字继续获取人数最多的第三方系统用户识别为的字;
S103-6.利用文字识别模块对该幅待识别文字图片中的该文字进行识别,以得出识别结果;
S103-7.判断所述识别结果是否与人数最多的第三方系统用户识别为的字相同,若相同,则执行步骤S103-8;若不同,则执行步骤S103-9;
S103-8.将该字确认为所述待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字;
S103-9.将该幅待识别文字图片再次分别分发给多个使用所述验证码系统的第三方系统,然后返回步骤S103-1,直至得出每幅所述待识别文字图片分别对应的所有确认文字。
步骤S103-5至S103-9发生在步骤S103-2之后,以及步骤S103-4之前。
其中,文字识别模块承载有文字识别软件,例如可以为现有的OCR(OpticalCharacter Recognition,光学字符识别)软件。
本公开实施例中,若验证码系统推送至第三方系统的待识别文字图片存在严重的不清晰问题,会导致针对该待识别文字图片中的每个文字无法实现超过预设数量的第三方系统用户识别为同一个字,则可以适当放宽标准,根据文字识别软件的识别结果来认定人数最多的第三方系统用户识别为的字是否正确,若正确则将该字确认为所述待识别文字图片中的相应文字,否则由第三方系统重新刷新验证码图片以提醒用户重新识别。
在一种实施方式中,在步骤S101之后,还包括如下步骤S104:
S104.将每幅所述待识别文字图片拆分成若干个子图片,其中每个所述子图片中包含若干待识别文字。
具体地,每个子图片中可以只有一个字,即:将待识别文字图片拆分成单个文字的子图片;每个子图片中也可以有两个字或三个及以上的字。
相应地,步骤S102具体为:将每幅所述待识别文字图片拆分而成的各个子图片分别分发给多个使用所述验证码系统的第三方系统,以使得各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片拆分而成的各个子图片分别对应的可编辑文字发送给所述验证码系统。
本公开实施例中,对待识别文字图片进行拆分,有利于提高第三方系统用户的识别效率和准确性。
在一种实施方式中,在步骤S104之后,还包括如下步骤S105:
S105.按照各幅所述待识别文字图片对应的行文习惯,分别对每幅所述待识别文字图片拆分而成的各个所述子图片进行排序。
其中,如果待识别文字图片中的文字为现代简化字,则其对于的行文习惯为从左到右、从上到下的顺序,那么该幅待识别文字图片拆分而成的各个子图片就按照这个顺序进行排序。
相应地,步骤S103中得出每幅所述待识别文字图片分别对应的所有确认文字,具体为:
得出每幅所述待识别文字图片拆分而成的各个所述子图片分别对应的确认文字;以及,
对于每幅待识别文字图片,将其拆分而成的各个所述子图片分别对应的确认文字按照各个所述子图片的排序方式进行组合,将组合后的文字作为该幅待识别文字图片对应的所有确认文字。
本公开实施例中,按照待识别文字图片的行文习惯对子图片进行排序,再将待识别文字图片拆分而成的各个子图片分别对应的确认文字按照各个子图片的排序方式进行组合,则组合后的可编辑文字的排列顺序与待识别文字图片中的文字顺序相符,提升了需求方的用户体验。
在一种实施方式中,在步骤S101之后,还包括如下步骤S106:
S106.将各幅所述待识别文字图片按照预设的优先级顺序进行编号并存储。例如可以存储到系统存储盘中。
相应地,步骤S102具体为:按照各幅所述待识别文字图片的编号顺序,依次将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统。
本公开实施例中,预先为各幅待识别文字图片进行编号,并按照编号顺序发送至第三方系统,则最后得出的与待识别文字图片对应的可编辑文档也是按照该编号顺序输出的,避免输出的各文档混乱、无序。
需要说明的是,上述步骤的顺序只是为了说明本公开实施例而提出的一个具体实例,本公开对上述步骤的顺序不做限定,本领域技术人员在实际应用中可按需对其进行调整。
图2为本公开实施例提供的另一种文字识别方法的流程示意图。所述文字识别方法应用于验证码系统,如图2所示,所述方法包括如下步骤S201至S209。
S201.接收需求方发送的一副待识别文字图片;
S202.存储所述待识别文字图片;
S203.将所述待识别文字图片拆分成若干个子图片,其中每个所述子图片中包含单个待识别文字;
S204.按照所述待识别文字图片对应的行文习惯,对所述待识别文字图片拆分而成的各个所述子图片进行排序;
S205.将所述待识别文字图片拆分而成的各个子图片分别发送给多个使用所述验证码系统的第三方系统,以使得各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片拆分而成的各个子图片分别对应的可编辑文字发送给所述验证码系统;
S206.接收各个所述第三方系统发送的所述待识别文字图片拆分而成的各个子图片分别对应的可编辑文字;
S207.对于所述待识别文字图片中的所有文字,判断是否均能实现半数以上的第三方系统用户达成共识,如是,则执行步骤S208,如否,则执行步骤S209;
S208.将半数以上的第三方系统用户都能够达成共识的文字作为对应的确认文字,再将所述待识别文字图片拆分而成的各个子图片分别对应的确认文字按照各个所述子图片的排序方式进行组合,以及将组合后的文字形成为可编辑文档后发送给所述需求方;
S209.提示识别无法达成一致,并返回步骤S205。
本公开实施例提供的文字识别方法,通过验证码系统接收需求方需验证的纸质文字扫描而成的待识别文字图片,由其分发给使用所述验证码系统的多个第三方系统,由各个第三方系统用户对该待识别文字图片中的文字进行识别,再通过设定阈值以大多数第三方系统用户识别的结果为准,以得出每幅待识别文字图片分别对应的所有确认文字并发送给所述需求方,从而基于统计学原理实现了对无法通过现有文字识别软件识别出来的纸质文字的可编辑电子化。
图3为本公开实施例提供的一种文字识别系统的结构示意图。所述文字识别系统包括:验证码系统200,如图3所示,验证码系统200包括:接收模块201、分发模块202和处理模块203。
其中,接收模块201设置为,接收需求方发送的各幅待识别文字图片;分发模块202设置为,将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;处理模块203设置为,按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
本公开实施例中,通过验证码系统将待识别文字图片分发给使用所述验证码系统的多个第三方系统,集思广益,充分发挥各个第三方系统用户的主观能动性,利用各个第三方系统用户的认知能力来正确识别待识别文字图片中的模糊文字,从而提高纸质文字电子化的准确率。
在一种实施方式中,处理模块203包括:统计单元、第一判断单元、确认单元和文档形成单元。
其中,统计单元设置为,分别对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行统计;第一判断单元设置为,针对每幅所述待识别文字图片中的每个文字,判断是否超过预设数量的第三方系统用户识别为同一个字;确认单元设置为,若所述第一判断单元的判断结果为超过预设数量的第三方系统用户识别为同一个字,则将该字确认为该幅待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字;文档形成单元设置为,将每幅所述待识别文字图片分别对应的所有确认文字形成为可编辑文档并发送给所述需求方。
本公开实施例中,该预设数量可以为所有第三方系统用户的一半数量,即针对该幅待识别文字图片中的每个文字,超过半数的第三方系统用户识别为同一个字时,将该字确认为该幅待识别文字图片中的相应文字;该预设数量也可以为一个具体的设定值,例如20,即针对该幅待识别文字图片中的每个文字,超过20位第三方系统用户识别为同一个字时,将该字确认为该幅待识别文字图片中的相应文字。
在一种实施方式中,处理模块203还包括:获取单元、识别单元和第二判断单元。
其中,获取单元设置为,若所述第一判断单元的判断结果为没有超过预设数量的第三方系统用户识别为同一个字,则对于该幅待识别文字图片中的该文字继续获取人数最多的第三方系统用户识别为的字;识别单元设置为,利用文字识别模块对该幅待识别文字图片中的该文字进行识别,以得出识别结果;第二判断单元设置为,判断所述识别结果是否与人数最多的第三方系统用户识别为的字相同;确认单元还设置为,若所述第二判断单元的判断结果为相同,则将该字确认为所述待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字。
相应地,分发模块202还设置为,若所述第二判断单元的判断结果为不同,则将该幅待识别文字图片再次分别分发给多个使用所述验证码系统的第三方系统,直至所述确认单元得出每幅所述待识别文字图片分别对应的所有确认文字。
其中,文字识别模块承载有文字识别软件,例如可以为现有的OCR(OpticalCharacter Recognition,光学字符识别)软件。
本公开实施例中,若验证码系统推送至第三方系统的待识别文字图片存在严重的不清晰问题,会导致针对该待识别文字图片中的每个文字无法实现超过预设数量的第三方系统用户识别为同一个字,则可以适当放宽标准,根据文字识别软件的识别结果来认定人数最多的第三方系统用户识别为的字是否正确,若正确则将该字确认为所述待识别文字图片中的相应文字,否则由第三方系统重新刷新验证码图片以提醒用户重新识别。
在一种实施方式中,验证码系统200还包括:拆分模块204。
拆分模块204设置为,将每幅所述待识别文字图片拆分成若干个子图片,其中每个所述子图片中包含若干待识别文字。
具体地,每个子图片中可以只有一个字,即:将待识别文字图片拆分成单个文字的子图片;每个子图片中也可以有两个字或三个及以上的字。
相应地,分发模块202具体设置为,将每幅所述待识别文字图片拆分而成的各个子图片分别分发给多个使用所述验证码系统的第三方系统,以使得各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片拆分而成的各个子图片分别对应的可编辑文字发送给所述验证码系统。
本公开实施例中,对待识别文字图片进行拆分,有利于提高第三方系统用户的识别效率和准确性。
在一种实施方式中,验证码系统200还包括:排序模块205。
排序模块205设置为,按照各幅所述待识别文字图片对应的行文习惯,分别对每幅所述待识别文字图片拆分而成的各个所述子图片进行排序。
其中,如果待识别文字图片中的文字为现代简化字,则其对于的行文习惯为从左到右、从上到下的顺序,那么该幅待识别文字图片拆分而成的各个子图片就按照这个顺序进行排序。
相应地,处理模块203具体设置为,得出每幅所述待识别文字图片拆分而成的各个所述子图片分别对应的确认文字;以及,对于每幅待识别文字图片,将其拆分而成的各个所述子图片分别对应的确认文字按照所述排序模块对各个所述子图片的排序方式进行组合,将组合后的文字作为该幅待识别文字图片对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
本公开实施例中,按照待识别文字图片的行文习惯对子图片进行排序,再将待识别文字图片拆分而成的各个子图片分别对应的确认文字按照各个子图片的排序方式进行组合,则组合后的可编辑文字的排列顺序与待识别文字图片中的文字顺序相符,提升了需求方的用户体验。
在一种实施方式中,验证码系统200还包括:存储模块206。
存储模块206设置为,将接收模块201接收的各幅所述待识别文字图片按照预设的优先级顺序进行编号并存储。
相应地,分发模块202具体设置为,按照各幅所述待识别文字图片的编号顺序,依次将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统。
本公开实施例中,预先为各幅待识别文字图片进行编号,并按照编号顺序发送至第三方系统,则最后得出的与待识别文字图片对应的可编辑文档也是按照该编号顺序输出的,避免输出的各文档混乱、无序。
图4为本公开实施例提供的另一种文字识别系统的结构示意图。所述文字识别系统包括:需求方100、验证码系统200和第三方系统300。
其中,验证码系统200采用前一实施例中的具体结构,此处不再赘述。第三方系统300包括用户识别模块301,其设置为接收验证码系统200发送的待识别文字图片,并将其作为验证码图片推送给用户,以及接收用户从该待识别文字图片中识别出并手动输入的文字,从而形成与该述待识别文字图片对应的可编辑文字,再反馈给验证码系统200。
本公开实施例提供的文字识别系统,通过验证码系统接收需求方需验证的纸质文字扫描而成的待识别文字图片,由其分发给使用所述验证码系统的多个第三方系统,由各个第三方系统用户对该待识别文字图片中的文字进行识别,再通过设定阈值以大多数第三方系统用户识别的结果为准,以得出每幅待识别文字图片分别对应的所有确认文字并发送给所述需求方,从而基于统计学原理实现了对无法通过现有文字识别软件识别出来的纸质文字的可编辑电子化。
基于相同的技术构思,本公开实施例相应还提供一种计算机设备,如图5所示,所述计算机设备5包括存储器51和处理器52,所述存储器51中存储有计算机程序,当所述处理器52运行所述存储器51存储的计算机程序时,所述处理器52执行前述文字识别方法。
基于相同的技术构思,本公开实施例相应还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,所述处理器执行前述文字识别方法。
综上所述,本公开实施例提供的文字识别方法、系统、计算机设备及存储介质,针对将纸质书籍文字识别为电子文档的过程中,容易因纸质文字模糊、显示不清而出现识别不准确的情况,本公开实施例通过验证码系统接收需求方需验证的纸质文字扫描而成的待识别文字图片,由其分发给使用所述验证码系统的多个第三方系统,由各个第三方系统用户对该待识别文字图片中的文字进行识别,再通过设定阈值以大多数第三方系统用户识别的结果为准,从而基于统计学原理实现了对不确定纸质文字的电子化认定。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
最后应说明的是:以上各实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。
Claims (12)
1.一种文字识别方法,其特征在于,应用于验证码系统,所述方法包括:
接收需求方发送的各幅待识别文字图片;
将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;以及,
按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
2.根据权利要求1所述的方法,其特征在于,按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,包括:
分别对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行统计;
针对每幅所述待识别文字图片中的每个文字,判断是否超过预设数量的第三方系统用户识别为同一个字;以及,
若超过预设数量的第三方系统用户识别为同一个字,则将该字确认为该幅待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若没有超过预设数量的第三方系统用户识别为同一个字,则对于该幅待识别文字图片中的该文字继续获取人数最多的第三方系统用户识别为的字;
利用文字识别模块对该幅待识别文字图片中的该文字进行识别,以得出识别结果;
判断所述识别结果是否与人数最多的第三方系统用户识别为的字相同;以及,
若相同,则将该字确认为所述待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字;
若不同,则将该幅待识别文字图片再次分别分发给多个使用所述验证码系统的第三方系统,直至得出每幅所述待识别文字图片分别对应的所有确认文字。
4.根据权利要求1-3中任一项所述的方法,其特征在于,在接收需求方发送的各幅待识别文字图片之后,所述方法还包括:
将每幅所述待识别文字图片拆分成若干个子图片,其中每个所述子图片中包含若干待识别文字;
将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,包括:
将每幅所述待识别文字图片拆分而成的各个子图片分别分发给多个使用所述验证码系统的第三方系统。
5.根据权利要求4所述的方法,其特征在于,在将每幅所述待识别文字图片拆分成若干个子图片之后,所述方法还包括:
按照各幅所述待识别文字图片对应的行文习惯,分别对每幅所述待识别文字图片拆分而成的各个所述子图片进行排序;
得出每幅所述待识别文字图片分别对应的所有确认文字,包括:
得出每幅所述待识别文字图片拆分而成的各个所述子图片分别对应的确认文字;以及,
对于每幅待识别文字图片,将其拆分而成的各个所述子图片分别对应的确认文字按照各个所述子图片的排序方式进行组合,将组合后的文字作为该幅待识别文字图片对应的所有确认文字。
6.一种文字识别系统,其特征在于,包括验证码系统,所述验证码系统包括:
接收模块,其设置为接收需求方发送的各幅待识别文字图片;
分发模块,其设置为将每幅所述待识别文字图片分别分发给多个使用所述验证码系统的第三方系统,以使各个所述第三方系统将其用户识别出并手动输入的与所述待识别文字图片对应的可编辑文字发送给所述验证码系统;以及,
处理模块,其设置为按照预设规则对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行处理,以得出每幅所述待识别文字图片分别对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
7.根据权利要求6所述的系统,其特征在于,所述处理模块包括:
统计单元,其设置为分别对各个所述第三方系统发送的每幅所述待识别文字图片对应的可编辑文字进行统计;
第一判断单元,其设置为针对每幅所述待识别文字图片中的每个文字,判断是否超过预设数量的第三方系统用户识别为同一个字;
确认单元,其设置为若所述第一判断单元的判断结果为超过预设数量的第三方系统用户识别为同一个字,则将该字确认为该幅待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字;以及,
文档形成单元,其设置为将每幅所述待识别文字图片分别对应的所有确认文字形成为可编辑文档并发送给所述需求方。
8.根据权利要求7所述的系统,其特征在于,所述处理模块还包括:
获取单元,其设置为若所述第一判断单元的判断结果为没有超过预设数量的第三方系统用户识别为同一个字,则对于该幅待识别文字图片中的该文字继续获取人数最多的第三方系统用户识别为的字;
识别单元,其设置为利用文字识别模块对该幅待识别文字图片中的该文字进行识别,以得出识别结果;以及,
第二判断单元,其设置为判断所述识别结果是否与人数最多的第三方系统用户识别为的字相同;
所述确认单元还设置为,若所述第二判断单元的判断结果为相同,则将该字确认为所述待识别文字图片中的相应文字,直至得出每幅所述待识别文字图片分别对应的所有确认文字;
所述分发模块还设置为,若所述第二判断单元的判断结果为不同,则将该幅待识别文字图片再次分别分发给多个使用所述验证码系统的第三方系统,直至所述确认单元得出每幅所述待识别文字图片分别对应的所有确认文字。
9.根据权利要求6-8中任一项所述的系统,其特征在于,所述验证码系统还包括:
拆分模块,其设置为将每幅所述待识别文字图片拆分成若干个子图片,其中每个所述子图片中包含若干待识别文字;
则所述分发模块具体设置为,将每幅所述待识别文字图片拆分而成的各个子图片分别分发给多个使用所述验证码系统的第三方系统。
10.根据权利要求9所述的系统,其特征在于,所述验证码系统还包括:
排序模块,其设置为按照各幅所述待识别文字图片对应的行文习惯,分别对每幅所述待识别文字图片拆分而成的各个所述子图片进行排序;
所述处理模块具体设置为,得出每幅所述待识别文字图片拆分而成的各个所述子图片分别对应的确认文字;以及,对于每幅待识别文字图片,将其拆分而成的各个所述子图片分别对应的确认文字按照所述排序模块对各个所述子图片的排序方式进行组合,将组合后的文字作为该幅待识别文字图片对应的所有确认文字,将其形成为可编辑文档并发送给所述需求方。
11.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行根据权利要求1至5中任一项所述的文字识别方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,所述处理器执行根据权利要求1至5中任一项所述的文字识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010647824.3A CN111783066B (zh) | 2020-07-07 | 2020-07-07 | 文字识别方法、系统、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010647824.3A CN111783066B (zh) | 2020-07-07 | 2020-07-07 | 文字识别方法、系统、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783066A true CN111783066A (zh) | 2020-10-16 |
CN111783066B CN111783066B (zh) | 2023-10-27 |
Family
ID=72758117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010647824.3A Active CN111783066B (zh) | 2020-07-07 | 2020-07-07 | 文字识别方法、系统、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783066B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297548A (zh) * | 2021-04-06 | 2021-08-24 | 北京理工大学 | 人机协同方式的验证码识别方法及其系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101388078A (zh) * | 2008-09-27 | 2009-03-18 | 腾讯科技(深圳)有限公司 | 基于验证的文本识别的方法及装置 |
CN102467653A (zh) * | 2010-10-29 | 2012-05-23 | 方正国际软件(北京)有限公司 | 一种图文识别方法及系统 |
CN103179092A (zh) * | 2011-12-22 | 2013-06-26 | 阿里巴巴集团控股有限公司 | 一种验证码信息的提供方法、系统及装置 |
CN103186781A (zh) * | 2011-12-31 | 2013-07-03 | 北京新媒传信科技有限公司 | 文本识别方法 |
CN104852916A (zh) * | 2015-05-08 | 2015-08-19 | 西安石油大学 | 一种基于社会工程学的网页验证码识别方法及系统 |
US20160164882A1 (en) * | 2014-12-05 | 2016-06-09 | Inventec (Pudong) Technology Corporation | Verification Code Generating System And Method |
CN106682667A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 非常见字体的图像文字ocr识别系统 |
CN109388932A (zh) * | 2017-08-07 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 验证方法及终端设备、数据处理方法 |
CN110909737A (zh) * | 2019-11-14 | 2020-03-24 | 武汉虹旭信息技术有限责任公司 | 图片文字识别方法及系统 |
-
2020
- 2020-07-07 CN CN202010647824.3A patent/CN111783066B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101388078A (zh) * | 2008-09-27 | 2009-03-18 | 腾讯科技(深圳)有限公司 | 基于验证的文本识别的方法及装置 |
CN102467653A (zh) * | 2010-10-29 | 2012-05-23 | 方正国际软件(北京)有限公司 | 一种图文识别方法及系统 |
CN103179092A (zh) * | 2011-12-22 | 2013-06-26 | 阿里巴巴集团控股有限公司 | 一种验证码信息的提供方法、系统及装置 |
CN103186781A (zh) * | 2011-12-31 | 2013-07-03 | 北京新媒传信科技有限公司 | 文本识别方法 |
US20160164882A1 (en) * | 2014-12-05 | 2016-06-09 | Inventec (Pudong) Technology Corporation | Verification Code Generating System And Method |
CN104852916A (zh) * | 2015-05-08 | 2015-08-19 | 西安石油大学 | 一种基于社会工程学的网页验证码识别方法及系统 |
CN106682667A (zh) * | 2016-12-29 | 2017-05-17 | 成都数联铭品科技有限公司 | 非常见字体的图像文字ocr识别系统 |
CN109388932A (zh) * | 2017-08-07 | 2019-02-26 | 阿里巴巴集团控股有限公司 | 验证方法及终端设备、数据处理方法 |
CN110909737A (zh) * | 2019-11-14 | 2020-03-24 | 武汉虹旭信息技术有限责任公司 | 图片文字识别方法及系统 |
Non-Patent Citations (7)
Title |
---|
PRASETYO ADI WIBOWO PUTRO等: "An Authentic and Secure Printed Document from Forgery Attack by Combining Perceptual Hash and Optical Character Recognition", 《2019 INTERNATIONAL CONFERENCE ON INFORMATICS, MULTIMEDIA, CYBER AND INFORMATION SYSTEM (ICIMCIS)》, pages 157 - 162 * |
刘余霞等: "基于Bagging集成学习的字符识别方法", 《计算机工程与应用》, vol. 48, no. 33, pages 194 - 196 * |
张华: "隐式验证码的设计与实现", 《电信工程技术与标准化》, vol. 29, no. 10, pages 54 - 57 * |
武越等: "验证码安全性检测与评估系统", 《大众科技》, vol. 16, no. 11, pages 14 - 17 * |
闫亚旗等: "物联网产业现状与技术发展", 《信息通信技术》, vol. 12, no. 4, pages 19 - 25 * |
陶蒙华: "融合的互动媒体技术与应用分析", 《移动通信》, vol. 36, no. 23, pages 21 - 24 * |
齐飞: "信息化技术助力物流业发展", 《中国电信业》, no. 10, pages 28 - 29 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297548A (zh) * | 2021-04-06 | 2021-08-24 | 北京理工大学 | 人机协同方式的验证码识别方法及其系统 |
CN113297548B (zh) * | 2021-04-06 | 2022-07-08 | 北京理工大学 | 人机协同方式的验证码识别方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111783066B (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102782702B (zh) | 在光学字符识别(ocr)过程中的段落识别 | |
CN102467653A (zh) | 一种图文识别方法及系统 | |
CN112287914A (zh) | Ppt视频段提取方法、装置、设备及介质 | |
CN103136302A (zh) | 试题重复输出的方法和装置 | |
CN112115111A (zh) | 一种基于ocr的文档版本管理方法和系统 | |
CN112418304B (zh) | Ocr模型训练方法、系统及装置 | |
CN103559512B (zh) | 一种文字识别输出方法及系统 | |
CN105488471B (zh) | 一种字形识别方法及装置 | |
CN107729491B (zh) | 提高题目答案搜索的准确率的方法、装置及设备 | |
CN111783066A (zh) | 文字识别方法、系统、计算机设备及存储介质 | |
CN110516125B (zh) | 识别异常字符串的方法、装置、设备及可读存储介质 | |
CN112016424A (zh) | 结合rpa和ai的图像数据处理方法与电子设备 | |
CN109409363A (zh) | 基于内容的文本图像颠倒判断及校正方法 | |
CN117975934A (zh) | 音频文本对的获取方法和装置、电子设备、存储介质 | |
CN111428569A (zh) | 基于人工智能的绘本或教材的视觉识别方法及装置 | |
CN106339965A (zh) | 一种学情分析方法 | |
US11747914B2 (en) | System and method for providing electric book based on reading type | |
KR20190103533A (ko) | 인터넷 동영상을 활용한 맞춤형 학습 콘텐츠 제공시스템 및 방법 | |
CN103279754A (zh) | 名片云识别方法及系统 | |
CN113343652A (zh) | 文本处理方法、装置、设备及介质 | |
CN204856534U (zh) | 一种基于ocr和tts的低视力阅读助视系统 | |
CN113947510A (zh) | 一种基于文件格式自适应的不动产电子证照管理系统 | |
CN110647785B (zh) | 一种输入文本的准确性的识别方法、装置及电子设备 | |
CN113179494A (zh) | 基于短信的业务办理方法及系统 | |
CN110765826A (zh) | 一种可移植文档格式pdf中的乱码识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |