CN113723420A - 一种扫描方法及其相关设备 - Google Patents

一种扫描方法及其相关设备 Download PDF

Info

Publication number
CN113723420A
CN113723420A CN202111033580.0A CN202111033580A CN113723420A CN 113723420 A CN113723420 A CN 113723420A CN 202111033580 A CN202111033580 A CN 202111033580A CN 113723420 A CN113723420 A CN 113723420A
Authority
CN
China
Prior art keywords
character
scanning
image
defective
scanned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111033580.0A
Other languages
English (en)
Other versions
CN113723420B (zh
Inventor
朱翠玲
刘丛刚
李守毅
杨训杰
张蔚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Toycloud Technology Co Ltd
Original Assignee
Anhui Toycloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Toycloud Technology Co Ltd filed Critical Anhui Toycloud Technology Co Ltd
Priority to CN202111033580.0A priority Critical patent/CN113723420B/zh
Publication of CN113723420A publication Critical patent/CN113723420A/zh
Application granted granted Critical
Publication of CN113723420B publication Critical patent/CN113723420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Character Input (AREA)

Abstract

本申请公开了一种扫描方法及其相关设备,该方法包括:在获取到针对待扫描对象的扫描图像之后,先确定该扫描图像中的缺损字符和该扫描图像的图像识别文本;再对该图像识别文本进行语义分析处理,得到待使用语义信息;然后,根据该待使用语义信息,确定该缺损字符的至少一个候选补全字符;最后,利用该至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的缺损字符,得到该待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,如此能够有效地避免针对待扫描对象的扫描结果中出现不完整字符,从而能够提高扫描效果,进而能够提高用户扫描体验。

Description

一种扫描方法及其相关设备
技术领域
本申请涉及人工智能技术领域,尤其涉及一种扫描方法及其相关设备。
背景技术
随着扫描技术的快速发展,扫描设备(例如,扫描笔等)的应用范围越来越广。例如,具有词典功能的扫描笔可以代替传统按键电子词典进行生词查询,使得该具有词典功能的扫描笔深受语言学习者的喜爱。
然而,因扫描设备存在缺陷,使得利用该扫描设备针对一个扫描介质的扫描结果也可能存在缺陷(例如,存在不完整字符等缺陷),如此易导致扫描效果较差,从而导致用户扫描体验比较差。
发明内容
本申请实施例的主要目的在于提供一种扫描方法及其相关设备,能够提高扫描效果,从而能够提高用户扫描体验。
本申请实施例提供了一种扫描方法,所述方法包括:
在获取到针对待扫描对象的扫描图像之后,确定所述扫描图像中的缺损字符和所述扫描图像的图像识别文本;
对所述图像识别文本进行语义分析处理,得到待使用语义信息;
根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符;
利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
在一种可能的实施方式中,所述缺损字符的确定过程,包括:
根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;
将所述设备扫描轨迹与所述理论扫描轨迹进行比较,得到扫描轨迹比较结果;
根据所述扫描轨迹比较结果,确定所述缺损字符。
在一种可能的实施方式中,所述设备扫描轨迹包括待使用字符的实际扫描边界位置;所述理论扫描轨迹包括所述待使用字符的理论扫描边界位置;
所述根据所述扫描轨迹比较结果,确定所述缺损字符,包括:
若所述扫描轨迹比较结果表示所述待使用字符的实际扫描边界位置与所述待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,则将所述待使用字符确定为所述缺损字符。
在一种可能的实施方式中,所述方法还包括:
对所述图像识别文本进行异常字符识别处理,得到异常字符识别结果;
所述根据所述扫描轨迹比较结果,确定所述缺损字符,包括:
根据所述扫描轨迹比较结果和所述异常字符识别结果,确定所述缺损字符。
在一种可能的实施方式中,所述设备扫描轨迹包括待使用字符的实际扫描边界位置;所述理论扫描轨迹包括所述待使用字符的理论扫描边界位置;
所述根据所述扫描轨迹比较结果和所述异常字符识别结果,确定所述缺损字符,包括:
若所述扫描轨迹比较结果表示所述待使用字符的实际扫描边界位置与所述待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,或者所述异常字符识别结果表示所述待使用字符不是标准字符,则将所述待使用字符确定为所述缺损字符。
在一种可能的实施方式中,所述图像识别文本的确定过程,包括:
根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;
按照所述理论扫描轨迹,对所述扫描图像进行裁剪处理,得到待使用图像;
对所述待使用图像进行字符识别处理,得到所述图像识别文本。
在一种可能的实施方式中,所述扫描识别文本的确定过程,包括:
根据各个所述候选补全字符与所述缺损字符之间的相似度,从所述至少一个候选补全字符中确定满足预设相似条件的目标补全字符;
利用所述目标补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
在一种可能的实施方式中,所述候选补全字符的个数为M,且第m个候选补全字符与所述缺损字符之间的相似度的确定过程,包括:
获取所述缺损字符的字符图像和所述第m个候选补全字符的字符图像;其中,m为正整数,m≤M,M为正整数;
根据所述第m个候选补全字符的字符图像与所述缺损字符的字符图像之间的相似度,确定所述第m个候选补全字符与所述缺损字符之间的相似度。
在一种可能的实施方式中,所述缺损字符的字符图像的获取过程,包括:
按照所述缺损字符的图像位置信息,从所述扫描图像中截取所述缺损字符的字符图像;
或者,
所述缺损字符的字符图像的获取过程,包括:
根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;按照所述理论扫描轨迹,对所述扫描图像进行裁剪处理,得到待使用图像;按照所述缺损字符的图像位置信息,从所述待使用图像中截取所述缺损字符的字符图像。
在一种可能的实施方式中,所述确定所述扫描图像中的缺损字符,包括:
确定所述扫描图像中的多个缺损字符;
所述根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符,包括:
根据所述待使用语义信息和各个所述缺损字符的文本位置信息,分别确定各个所述缺损字符的至少一个候选补全字符;
所述利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本,包括:
利用各个所述缺损字符的至少一个候选补全字符中的一个候选补全字符,分别替换所述图像识别文本中的各个所述缺损字符,得到所述待扫描对象的扫描识别文本。
在一种可能的实施方式中,所述方法还包括:
对所述扫描识别文本进行显示处理;
和/或,
对所述扫描识别文本进行预设文本处理,得到处理后文本;对所述处理后文本进行显示处理。
本申请实施例还提供了一种扫描装置,包括:
第一确定单元,用于在获取到针对待扫描对象的扫描图像之后,确定所述扫描图像中的缺损字符和所述扫描图像的图像识别文本;
语义分析单元,用于对所述图像识别文本进行语义分析处理,得到待使用语义信息;
第二确定单元,用于根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符;
字符替换单元,用于利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
本申请实施例还提供了一种设备,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行本申请实施例提供的扫描方法的任一实施方式。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行本申请实施例提供的扫描方法的任一实施方式。
本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行本申请实施例提供的扫描方法的任一实施方式。
基于上述技术方案,本申请具有以下有益效果:
本申请提供的技术方案中,在获取到针对待扫描对象的扫描图像之后,先确定该扫描图像中的缺损字符和该扫描图像的图像识别文本;再对该图像识别文本进行语义分析处理,得到待使用语义信息;然后,根据该待使用语义信息,确定该缺损字符的至少一个候选补全字符;最后,利用该至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的缺损字符,得到该待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,如此能够有效地避免针对待扫描对象的扫描结果中出现不完整字符,从而能够提高扫描效果,进而能够提高用户扫描体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种理论扫描轨迹的示意图;
图2为本申请实施例提供的一种实际扫描轨迹的示意图;
图3为本申请实施例提供的应用于扫描设备的扫描方法的应用场景示意图;
图4为本申请实施例提供的应用于服务器的扫描方法的应用场景示意图;
图5为本申请实施例提供的一种扫描方法的流程图;
图6为本申请实施例提供的一种设备扫描轨迹和理论扫描轨迹的结构示意图;
图7为本申请实施例提供的一种待使用图像的示意图;
图8为本申请实施例提供的一种缺损字符的字符图像的示意图;
图9为本申请实施例提供的一种扫描装置的结构示意图。
具体实施方式
发明人在针对扫描设备的研究中发现,因扫描设备(如图1所示的扫描笔101)存在缺陷,使得利用该扫描设备针对一个扫描介质的扫描结果也可能存在缺陷(例如,存在不完整字符等缺陷),如此易导致扫描效果较差,从而导致用户扫描体验比较差。为了便于理解,下面以图1所示的扫描笔101为例进行说明。
作为示例,对于图1所示的扫描笔101来说,因该扫描笔101是利用其笔尖内嵌的摄像头来完成针对一个扫描介质(例如,一张纸)的扫描工作,使得在利用该扫描笔101进行扫描时应该尽可能地保证该扫描笔101沿着直线(如图1所示的理论扫描轨迹)进行扫描。可见,为了保证扫描笔101的扫描效果,用户通常需要达到以下控制要求:用户应该控制扫描笔101尽可能平稳地沿着直线路径(如图1所示的理论扫描轨迹)进行移动,不能发生晃动,以避免因扫描笔101发生晃动而导致扫描结果中出现不完整字符的现象。
然而,因有些用户(例如,儿童等)针对扫描笔101的控制能力有限(例如,无法长时间控制扫描笔101平稳地沿着直线路径移动),使得该扫描笔101的实际移动路线(如图2所示的实际扫描轨迹)可能会发生幅度比较大的晃动,从而使得该扫描笔101的扫描轨迹发生比较严重的局部偏移(如图2所示的局部偏移区域201)现象,进而使得该扫描笔101的扫描结果中易出现不完整字符的现象,如此导致该扫描笔101的扫描效果不好。
基于上述发现,为了解决背景技术部分的技术问题,本申请实施例提供了一种扫描方法,该方法包括:在获取到针对待扫描对象的扫描图像之后,先确定该扫描图像中的缺损字符和该扫描图像的图像识别文本;再对该图像识别文本进行语义分析处理,得到待使用语义信息;然后,根据该待使用语义信息,确定该缺损字符的至少一个候选补全字符;最后,利用该至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的缺损字符,得到该待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,如此能够有效地避免针对待扫描对象的扫描结果中出现不完整字符,从而能够提高扫描效果,进而能够提高用户扫描体验。
另外,本申请实施例不限定扫描方法的执行主体,例如,本申请实施例提供的扫描方法可以应用于扫描设备或服务器。其中,扫描设备是指具有扫描功能的终端设备;而且本申请实施例不限定扫描设备,例如,该扫描设备可以为扫描笔、配置有扫描元件的智能手机、配置有扫描元件的计算机、配置有扫描元件的个人数字助理(Personal DigitalAssitant,PDA)、或者配置有扫描元件的平板电脑等。服务器可以为独立服务器、集群服务器或云服务器。
为了便于理解本申请实施例提供的技术方案,下面分别结合图3和图4对本申请实施例提供的扫描方法的应用场景进行示例性介绍。其中,图3为本申请实施例提供的应用于扫描设备的扫描方法的应用场景示意图;图4为本申请实施例提供的应用于服务器的扫描方法的应用场景示意图。
在图3所示的应用场景中,当用户301使用扫描设备302对待扫描对象(例如,一张记录有字符的纸等)进行扫描时,该扫描设备302可以接收针对该待扫描对象的扫描图像,并通过执行本申请实施例提供的扫描方法实现从该扫描图像中获取到不包括缺损字符的扫描识别文本。例如,由扫描设备302从扫描图像中获取扫描识别文本的过程具体可以包括:在扫描设备302获取到针对待扫描对象的扫描图像之后,先由该扫描设备302确定该扫描图像中的缺损字符和该扫描图像的图像识别文本;再由该扫描设备302对该图像识别文本进行语义分析处理,得到待使用语义信息;然后,由该扫描设备302根据该待使用语义信息,确定该缺损字符的至少一个候选补全字符;最后,由该扫描设备302利用该至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的缺损字符,得到该待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,以便后续由该扫描设备302直接将该待扫描对象的扫描识别文本和/或该扫描识别文本的处理后文本(例如,针对该扫描识别文本进行预设语言翻译处理得到的翻译结果;针对该扫描识别文本进行同义词查找得到的同义词查找结果;或者,针对该扫描识别文本进行反义词查找得到的反义词查找结果等等)展示给用户301,以使该用户301能够在该扫描设备302上查看这些信息。
在图4所示的应用场景中,当用户401使用扫描设备402对待扫描对象进行扫描时,该扫描设备402可以接收针对该待扫描对象的扫描图像,并由该扫描设备402将该扫描图像发送给服务器403,以使服务器403通过执行本申请实施例提供的扫描方法实现从该扫描图像中获取到不包括缺损字符的扫描识别文本。例如,由服务器403从扫描图像中获取扫描识别文本的过程具体可以包括:在服务器403获取到针对待扫描对象的扫描图像之后,先由该服务器403确定该扫描图像中的缺损字符和该扫描图像的图像识别文本;再由该服务器403对该图像识别文本进行语义分析处理,得到待使用语义信息;然后,由该服务器403根据该待使用语义信息,确定该缺损字符的至少一个候选补全字符;最后,由该服务器403利用该至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的缺损字符,得到该待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,以便后续由该服务器403将该待扫描对象的扫描识别文本和/或该扫描识别文本的处理后文本发送给扫描设备402,以使该扫描设备402能够将该待扫描对象的扫描识别文本和/或该扫描识别文本的处理后文本展示给用户401,以使该用户401能够在该扫描设备402上查看这些信息。
需要说明的是,本申请实施例提供的扫描方法不仅能够应用于图3或图4所示的应用场景中,还可以应用于其他需要进行扫描处理的应用场景中,本申请实施例对此不做具体限定。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例一
参见图5,该图为本申请实施例提供的一种扫描方法的流程图。
本申请实施例提供的扫描方法,包括S1-S4:
S1:在获取到针对待扫描对象的扫描图像之后,确定该扫描图像中的缺损字符和该扫描图像的图像识别文本。
其中,“待扫描对象”是指能够被扫描设备进行扫描处理的扫描介质;而且本申请实施例不限定“待扫描对象”,例如,可以是书中某一页、一张记录有字符的纸质文件等。
“扫描图像”是指由扫描设备针对待扫描对象进行扫描所得到的扫描结果;而且本申请实施例不限定“扫描图像”,例如,当扫描设备借助摄像头进行扫描处理时,则该“扫描图像”可以是指由扫描设备上摄像头针对待扫描对象进行拍摄得到的图像。
“缺损字符”是指在扫描图像中出现的不完整字符;而且本申请实施例不限定缺损字符的确定过程,例如,其具体可以包括步骤11-步骤13:
步骤11:根据扫描图像的设备扫描轨迹,确定该扫描图像的理论扫描轨迹。
其中,“设备扫描轨迹”用于描述当用户使用扫描设备扫描待扫描对象时实际按照的扫描路径;而且本申请实施例不限定“设备扫描轨迹”的表示方式,例如,如图6所示,其可以利用实际扫描上边界线和实际扫描下边界线进行表示。
“实际扫描上边界线”用于描述当用户使用扫描设备扫描待扫描对象时实际经过的扫描区域的上边界位置;而且本申请实施例不限定“实际扫描上边界线”,例如,其可以包括扫描图像中所有字符的实际扫描上边界位置。其中,“字符的实际扫描上边界位置”是指当用户使用扫描设备扫描该字符时实际经过的扫描区域的上边界位置。
“实际扫描下边界线”用于描述当用户使用扫描设备扫描待扫描对象时实际经过的扫描区域的下边界位置;而且本申请实施例不限定“实际扫描下边界线”,例如,其可以包括扫描图像中所有字符的实际扫描下边界位置。其中,“字符的实际扫描下边界位置”是指当用户使用扫描设备扫描该字符时实际经过的扫描区域的下边界位置。
另外,本申请实施例不限定“设备扫描轨迹”,例如,当扫描图像中存在K个字符时,则该“设备扫描轨迹”可以包括该扫描图像中第1个字符的实际扫描边界位置至第K个字符的实际扫描边界位置。其中,“第k个字符的实际扫描边界位置”是指当用户使用扫描设备扫描该字符时实际经过的扫描区域的区域边界位置;而且本申请实施例不限定“第k个字符的实际扫描边界位置”,例如,其可以包括第k个字符的实际扫描上边界位置和该第k个字符的实际扫描下边界位置。其中,k为正整数,k≤K,K为正整数。
“理论扫描轨迹”用于表示当用户使用扫描设备扫描待扫描对象时理应按照的扫描路径;而且本申请实施例不限定“理论扫描轨迹”的表示方式,例如,如图6所示,其可以利用理论扫描上边界线和/或理论扫描下边界线进行表示。
“理论扫描上边界线”用于描述当用户使用扫描设备扫描待扫描对象时理应经过的扫描区域的上边界位置;而且本申请实施例不限定“理论扫描上边界线”,例如,其可以包括扫描图像中所有字符的理论扫描上边界位置。其中,“字符的理论扫描上边界位置”用于表示当用户使用扫描设备扫描该字符时理应经过的扫描区域的上边界位置。
“理论扫描下边界线”用于表示当用户使用扫描设备扫描待扫描对象时理应经过的扫描区域的下边界位置;而且本申请实施例不限定“理论扫描下边界线”,例如,其可以包括扫描图像中所有字符的理论扫描下边界位置。其中,“字符的理论扫描下边界位置”用于表示当用户使用扫描设备扫描该字符时理应经过的扫描区域的下边界位置。
另外,本申请实施例不限定“理论扫描轨迹”,例如,当扫描图像中存在K个字符时,则该“理论扫描轨迹”可以包括该扫描图像中第1个字符的理论扫描边界位置至第K个字符的理论扫描边界位置。其中,“第k个字符的理论扫描边界位置”是指当用户使用扫描设备扫描该字符时理应经过的扫描区域的区域边界位置;而且本申请实施例不限定“第k个字符的理论扫描边界位置”,例如,其可以包括第k个字符的理论扫描上边界位置和该第k个字符的理论扫描下边界位置。其中,k为正整数,k≤K,K为正整数。
此外,本申请实施例不限定“理论扫描轨迹”的确定过程,为了便于理解,下面结合三个示例进行说明。
示例1,当上述“设备扫描轨迹”包括实际扫描上边界线和实际扫描下边界线时,该“理论扫描轨迹”的确定过程具体可以包括步骤21-步骤23:
步骤21:对实际扫描上边界线进行直线拟合处理,得到理论扫描上边界线。
其中,“直线拟合处理”用于针对一个非直线数据进行直线拟合;而且本申请实施例不限定“直线拟合处理”,可以采用现有的或者未来出现的任一种直线拟合方法进行实施。
步骤22:对实际扫描下边界线进行直线拟合处理,得到理论扫描下边界线。
步骤23:根据理论扫描上边界线和理论扫描下边界线,确定理论扫描轨迹。
本申请实施例中,在获取到理论扫描上边界线和理论扫描下边界线之后,可以直接将两者进行集合处理,得到理论扫描轨迹,以使该理论扫描轨迹包括理论扫描上边界线和理论扫描下边界线。
基于上述步骤21至步骤23的相关内容可知,对于包括实际扫描上边界线和实际扫描下边界线的“设备扫描轨迹”来说,可以分别针对实际扫描上边界线和实际扫描下边界线进行直线拟合处理,得到理论扫描上边界线和理论扫描下边界线,以便后续能够基于理论扫描上边界线和理论扫描下边界线,确定该“理论扫描轨迹”。
示例2,当上述“设备扫描轨迹”包括实际扫描上边界线时,该“理论扫描轨迹”的确定过程具体可以包括步骤31-步骤33:
步骤31:对实际扫描上边界线进行直线拟合处理,得到理论扫描上边界线。
需要说明的是,步骤31的相关内容请参见上文步骤21的相关内容。
步骤32:根据理论扫描上边界线和设备扫描宽度配置参数,确定理论扫描下边界线。
其中,“设备扫描宽度配置参数”用于表示扫描设备的扫描区域宽度(也就是,扫描区域的上边界与该扫描区域的下边界之间的距离);而且本申请实施例不限定“设备扫描宽度配置参数”,例如,可以预先设定,也可以根据用户的扫描区域宽度调整操作进行确定。“扫描区域宽度调整操作”用于针对扫描设备中扫描元件的扫描范围进行宽度调整。
另外,本申请实施例不限定步骤32的具体实施方式,例如,步骤32具体可以包括:将理论扫描上边界线按照设备扫描宽度配置参数进行竖直向下位置调整处理,得到该理论扫描下边界线。
步骤33:根据理论扫描上边界线和理论扫描下边界线,确定该“扫描图像的理论扫描轨迹”。
需要说明的是,步骤33的相关内容请参见上文步骤23的相关内容。
基于上述步骤31至步骤33的相关内容可知,对于包括实际扫描上边界线的“设备扫描轨迹”来说,可以先针对实际扫描上边界线进行直线拟合处理,得到理论扫描上边界线;再参考设备扫描宽度配置参数,对该理论扫描上边界线进行竖直向下位置调整处理,得到理论扫描下边界线;最后,基于理论扫描上边界线和理论扫描下边界线,确定该“理论扫描轨迹”。
示例3,当上述“设备扫描轨迹”包括实际扫描下边界线时,该“理论扫描轨迹”的确定过程具体可以包括步骤41-步骤43:
步骤41:对实际扫描下边界线进行直线拟合处理,得到理论扫描下边界线。
需要说明的是,步骤41的相关内容请参见上文步骤22的相关内容。
步骤42:根据理论扫描下边界线和设备扫描宽度配置参数,确定理论扫描上边界线。
其中,“设备扫描宽度配置参数”的相关内容请参见上文步骤32的相关内容。
另外,本申请实施例不限定步骤42的具体实施方式,例如,步骤42具体可以包括:将理论扫描下边界线按照设备扫描宽度配置参数进行竖直向上位置调整处理,得到该理论扫描上边界线。
步骤43:根据理论扫描上边界线和理论扫描下边界线,确定该“扫描图像的理论扫描轨迹”。
需要说明的是,步骤43的相关内容请参见上文步骤23的相关内容。
基于上述步骤41至步骤43的相关内容可知,对于包括实际扫描下边界线的“设备扫描轨迹”来说,可以先针对实际扫描下边界线进行直线拟合处理,得到理论扫描下边界线;再参考设备扫描宽度配置参数,对该理论扫描下边界线进行竖直向上位置调整处理,得到理论扫描上边界线;最后,基于理论扫描下边界线和理论扫描上边界线,确定该“理论扫描轨迹”。
基于上述步骤11的相关内容可知,当用户利用扫描设备扫描待扫描对象时,可以实时记录该扫描设备的实际移动轨迹,作为该扫描图像的设备扫描轨迹(如图6所示的包括“实际扫描上边界线”与“实际扫描下边界线”的设备扫描轨迹),以使该设备扫描轨迹能够准确地表示出该扫描图像的采集路径,并基于该设备扫描轨迹,推测该扫描图像的理论扫描轨迹(例如,如图6所示的“理论扫描上边界线”以及“理论扫描下边界线”),以使该理论扫描轨迹能够准确地表示出当用户使用扫描设备扫描待扫描对象时理应按照的理论扫描路径,以便后续能够借助上述“设备扫描轨迹”与上述“理论扫描轨迹”之间的差异性,确定出该扫描图像中存在的不完整字符。
步骤12:将扫描图像的设备扫描轨迹与该扫描图像的理论扫描轨迹进行比较,得到扫描轨迹比较结果。
其中,“扫描轨迹比较结果”用于表示扫描图像的设备扫描轨迹与该扫描图像的理论扫描轨迹之间的差异性;而且本申请实施例不限定“扫描轨迹比较结果”,例如,当扫描图像中存在K个字符时,该“扫描轨迹比较结果”可以包括该扫描图像中第1个字符的实际扫描边界位置与该第1个字符的理论扫描边界位置之间的相对关系、第2个字符的实际扫描边界位置与该第2个字符的理论扫描边界位置之间的相对关系、……、以及第K个字符的实际扫描边界位置与该第K个字符的理论扫描边界位置之间的相对关系。
另外,本申请实施例不限定“第k个字符的实际扫描边界位置与该第k个字符的理论扫描边界位置之间的相对关系”,例如,其具体可以包括第k个字符的实际扫描上边界位置与该第k个字符的理论扫描上边界位置之间的距离差值、和/或该第k个字符的实际扫描下边界位置与该第k个字符的理论扫描下边界位置之间的距离差值。
步骤13:根据扫描轨迹比较结果,确定缺损字符。
本申请实施例不限定步骤13的实施方式,例如,当上述“设备扫描轨迹”包括待使用字符的实际扫描边界位置,且上述“理论扫描轨迹”包括该待使用字符的理论扫描边界位置时,步骤13具体可以包括:若扫描轨迹比较结果表示该待使用字符的实际扫描边界位置与该待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,则将该待使用字符确定为缺损字符。其中,“待使用字符”用于代表扫描图像中任一字符。
其中,“预设位置条件”可以预先设定;而且本申请实施例不限定“预设位置条件”,例如,其具体可以包括待使用字符的实际扫描上边界位置与该待使用字符的理论扫描上边界位置之间的距离差值绝对值超过第一差值阈值;和/或,待使用字符的实际扫描下边界位置与该待使用字符的理论扫描下边界位置之间的距离差值绝对值超过第二差值阈值。其中,“第一差值阈值”可以预先设定;而且“第二差值阈值”也可以预先设定。
可见,对于扫描图像中第k个字符来说,如果确定第k个字符的实际扫描上边界位置与该第k个字符的理论扫描上边界位置之间的距离差值绝对值超过第一差值阈值,则可以确定该第k个字符的实际扫描边界位置与该第k个字符的理论扫描边界位置之间的相对关系满足预设位置条件,故可以将该第k个字符确定为缺损字符;如果确定该第k个字符的实际扫描下边界位置与该第k个字符的理论扫描下边界位置之间的距离差值绝对值超过第二差值阈值,则也可以确定该第k个字符的实际扫描边界位置与该第k个字符的理论扫描边界位置之间的相对关系满足预设位置条件,故也可以将该第k个字符确定为缺损字符;如果确定该第k个字符的实际扫描上边界位置与该第k个字符的理论扫描上边界位置之间的距离差值绝对值不超过第一差值阈值,且确定该第k个字符的实际扫描下边界位置与该第k个字符的理论扫描下边界位置之间的距离差值绝对值不超过第二差值阈值,则可以确定该第k个字符的实际扫描边界位置与该第k个字符的理论扫描边界位置之间的相对关系不满足预设位置条件,从而可以推测该第k个字符应该是完整字符,故可以将该第k个字符确定为完整字符。其中,k为正整数,k≤K,K为正整数,K表示扫描图像中的字符个数。
基于上述步骤11至步骤13的相关内容可知,在一些情况下,可以参考扫描图像的设备扫描轨迹与该扫描图像的理论扫描轨迹之间的差异性,识别该扫描图像中存在的缺损字符。
另外,为了进一步提高缺损字符的识别准确性,本申请实施例还提供了确定缺损字符的另一种可能的实施方式,其具体可以包括步骤51-步骤54:
步骤51:根据扫描图像的设备扫描轨迹,确定该扫描图像的理论扫描轨迹。
步骤52:将扫描图像的设备扫描轨迹与该扫描图像的理论扫描轨迹进行比较,得到扫描轨迹比较结果。
需要说明的是,步骤51-步骤52的相关内容分别请参见上文步骤11-步骤12。
步骤53:对扫描图像的图像识别文本进行异常字符识别处理,得到异常字符识别结果。
其中,“图像识别文本”用于表示扫描图像携带的字符信息;而且本申请实施例不限定该“图像识别文本”的确定过程,例如,其具体可以包括:针对该扫描图像进行字符识别处理,得到该“图像识别文本”。需要说明的是,本申请实施例不限定“字符识别处理”,可以采用现有的或者未来出现的任一种能够针对一个图像数据进行字符识别处理的方法进行实施。
另外,为了尽可能地降低因扫描轨迹发生局部偏移对图像识别文本造成的不良影响,本申请实施例还提供了确定“图像识别文本”的另一种可能的实施方式,其具体可以包括:先按照上述“理论扫描轨迹”,对扫描图像进行裁剪处理,得到待使用图像;再对该待使用图像进行字符识别处理,得到扫描图像的图像识别文本。其中,“待使用图像”用于表示上述“扫描图像”与由上述“理论扫描轨迹”所圈定的理论扫描区域之间的交集。
可见,在获取到扫描图像之后,可以先按照上述“理论扫描轨迹”,对该扫描图像进行裁剪处理,得到待使用图像,以使该待使用图像中尽可能地不出现多余字符(例如,下一行中的字符),从而使得该待使用图像能够尽可能更准确地表示出该扫描图像所携带的字符信息;再对待使用图像进行字符识别处理,得到扫描图像的图像识别文本,以使该图像识别文本能够更准确地表示出该扫描图像所携带的字符信息,如此能够尽可能地降低因扫描轨迹发生局部偏移对图像识别文本造成的不良影响,从而有利于提高图像识别文本的准确性。
步骤53中“异常字符识别处理”用于针对一个文本数据进行非标准字符识别处理。“标准字符”是指在通用字典中存在的字符,而且“非标准字符”可以是指在通用字典中不存在的字符。
另外,本申请实施例不限定“异常字符识别处理”的实施方式,可以采用现有的或者未来出现的任一种能够从一个文本数据中识别各个非标准字符的方法进行实施。
“异常字符识别结果”用于表示扫描图像中各个字符是否为标准字符(也就是,用于表示扫描图像中各个字符是否能够在通用字典中查找到);而且本申请实施例不限定“异常字符识别结果”,例如,当扫描图像中存在K个字符时,该“异常字符识别结果”可以包括该扫描图像中第1个字符的字符识别结果、第2个字符的字符识别结果、……、以及第K个字符的字符识别结果。其中,“第k个字符的字符识别结果”用于表示该扫描图像中第1个字符是否为标准字符。其中,k为正整数,k≤K,K为正整数。
步骤54:根据扫描轨迹比较结果和异常字符识别结果,确定缺损字符。
本申请实施例不限定步骤54的实施方式,例如,当上述“设备扫描轨迹”包括待使用字符的实际扫描边界位置,且上述“理论扫描轨迹”包括该待使用字符的理论扫描边界位置时,步骤54具体可以包括:若扫描轨迹比较结果表示该待使用字符的实际扫描边界位置与该待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,或者异常字符识别结果表示该待使用字符不是标准字符,则将该待使用字符确定为缺损字符。
可见,对于扫描图像中第k个字符来说,如果确定该第k个字符的实际扫描边界位置与该第k个字符的理论扫描边界位置之间的相对关系满足预设位置条件,则可以将该第k个字符确定为缺损字符;如果确定该第k个字符不是标准字符,则也可以将该待使用字符确定为缺损字符;如果确定该第k个字符的实际扫描边界位置与该第k个字符的理论扫描边界位置之间的相对关系不满足预设位置条件,且确定该第k个字符为标准字符,则可以将该第k个字符确定为完整字符。其中,k为正整数,k≤K,K为正整数,K表示扫描图像中的字符个数。
基于上述步骤51至步骤54的相关内容可知,在一些情况下,可以综合参考扫描图像的设备扫描轨迹与该扫描图像的理论扫描轨迹之间的差异性、以及针对该扫描图像的图像识别文本得到的异常字符识别结果,识别该扫描图像中存在的缺损字符,如此不仅能够从该扫描图像中识别出因扫描轨迹发生局部偏移而导致的缺损字符,还能够识别出因其他原因而导致的缺损字符(例如,待扫描对象中原本存在的不完整字符、错误字符等、和/或,因用户针对扫描设备的操作失误(例如,扫描起始位置选择错误、结束位置选择错误等)而导致的不完整字符等)。
基于上述S1的相关内容可知,在获取到针对待扫描对象的扫描图像之后,可以确定该扫描图像的图像识别文本,并从该扫描图像中识别出缺损字符,以便后续能够参考该图像识别文本的语义信息,针对该缺损字符进行字符补全处理。
S2:对扫描图像的图像识别文本进行语义分析处理,得到待使用语义信息。
其中,“语义分析处理”用于针对一个文本数据进行语义分析;而且本申请实施例不限定“语义分析处理”,可以采用现有的或者未来出现的任一种能够针对一个文本数据进行语义分析的方法进行实施。
“待使用语义信息”用于表示上述“扫描图像的图像识别文本”所携带的语义信息。
S3:根据待使用语义信息,确定缺损字符的至少一个候选补全字符。
其中,“缺损字符的至少一个候选补全字符”是指能够在上述“扫描图像的图像识别文本”中代替该缺损字符的至少一个字符;而且本申请实施例不限定“缺损字符的至少一个候选补全字符”,例如,其可以包括能够表达出该缺损字符的语义信息的至少一个字符。
另外,本申请实施例不限定S3的实施方式,例如,可以采用现有的或者未来出现的任一种能够基于一个文本数据的语义信息预测该文本数据中某个字符的方法进行实施。又如,还可以采用预先构建的字符预测模型进行实施。
“字符预测模型”用于针对该“字符预测模型”的输入数据进行字符预测处理;而且该“字符预测模型”可以根据样本文本、该样本文本的语义信息、以及该样本文本对应的实际字符。其中,“样本文本”是指存在漏字、错字、或者不完整字符等现象的文本数据。“样本文本的语义信息”用于表示该样本文本携带的实际语义信息。“样本文本对应的实际字符”是指用于克服上述漏字、错字、或者不完整字符等现象时所需使用的实际字符。
基于上述S3的相关内容可知,在获取到待使用语义信息之后,可以参考该待使用语义信息,确定上述“扫描图像的图像识别文本”中缺损字符所携带的语义信息可以被那些字符进行表达,并将这些字符确定为该缺损字符的至少一个候选补全字符,以便后续能够从这些候选补全字符中选择出能够代替该缺损字符的一个候选补全字符。
S4:利用至少一个候选补全字符中的一个候选补全字符替换图像识别文本中的缺损字符,得到待扫描对象的扫描识别文本。
本申请实施例中,在获取到上述“扫描图像的图像识别文本”中缺损字符的至少一个候选补全字符之后,可以从该至少一个候选补全字符中随机选择一个候选补全字符,并利用该“随机选择的一个候选补全字符”替换该“扫描图像的图像识别文本”中缺损字符,得到待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,如此能够有效地避免针对待扫描对象的扫描结果中出现不完整字符,从而能够提高扫描效果,进而能够提高用户扫描体验。
另外,为了进一步提高扫描识别文本的准确性,本申请实施例还提供了S4的另一种可能的实施方式,S4具体可以包括S41-S42:
S41:根据各个候选补全字符与缺损字符之间的相似度,从至少一个候选补全字符中确定满足预设相似条件的目标补全字符。
其中,第m个候选补全字符与缺损字符之间的相似度用于表示利用该第m个候选补全字符替换该缺损字符的可能性。可见,若第m个候选补全字符与缺损字符之间的相似度越大,则表示利用该第m个候选补全字符替换该缺损字符的可能性越大;若第m个候选补全字符与缺损字符之间的相似度越小,则表示利用该第m个候选补全字符替换该缺损字符的可能性越小。其中,m为正整数,m≤M,M为正整数,M表示上述“至少一个候选补全字符”中的候选补全字符个数。
另外,本申请实施例不限定“第m个候选补全字符与缺损字符之间的相似度”的确定过程,例如,可以直接按照预设字符相似度计算方法,计算第m个候选补全字符与缺损字符之间的相似度。其中,“预设字符相似度计算方法”可以是现有的或者未来出现的任一种能够计算两个字符之间相似程度的方法进行实施。
为了进一步提高扫描识别文本的准确性,本申请实施例还提供了确定“第m个候选补全字符与缺损字符之间的相似度”的另一种可能的实施方式,其具体可以包括步骤61-步骤63:
步骤61:获取缺损字符的字符图像。
其中,“缺损字符的字符图像”用于表示上述“扫描图像”中的缺损字符的字符轮廓;而且本申请实施例不限定“缺损字符的字符图像”的表示方式,例如,可以采用上述“扫描图像”中缺损字符的所处区域进行表示。
另外,本申请实施例不限定“缺损字符的字符图像”的获取方式,例如,可以直接按照缺损字符的图像位置信息,从扫描图像中截取该缺损字符的字符图像。其中,“缺损字符的图像位置信息”可以是指该缺损字符在上述“扫描图像”中所处区域的位置信息。
此外,为了尽可能地降低因扫描轨迹发生局部偏移对缺损字符的不良影响,本申请实施例还提供了获取“缺损字符的字符图像”的另一种可能的实施方式,其具体可以包括步骤611-步骤613:
步骤611:根据扫描图像的设备扫描轨迹,确定该扫描图像的理论扫描轨迹。
需要说明的是,步骤611的相关内容请参见上文步骤11。
步骤612:按照扫描图像的理论扫描轨迹,对该扫描图像进行裁剪处理,得到待使用图像。
需要说明的是,“待使用图像”的相关内容请参见上文步骤53所示的“待使用图像”的相关内容。
步骤613:按照缺损字符的图像位置信息,从待使用图像中截取缺损字符的字符图像。
本申请实施例中,在获取到待使用图像之后,可以按照该缺损字符的图像位置信息,从待使用图像中截取缺损字符的字符图像,以使该缺损字符的字符图像用于表示上述“缺损字符的图像位置信息”所示的图像区域与上述“理论扫描轨迹”所示的图像区域之间的交集,从而使得该缺损字符的字符图像中尽可能地不出现多余字符(例如,下一行中的字符),如此能够尽可能地降低因扫描轨迹发生局部偏移对缺损字符的不良影响,从而有利于提高字符补全效果。
基于上述步骤61的相关内容可知,在确定出扫描图像中的缺损字符之后,可以依据该扫描图像,确定该缺损字符的字符图像,以使该字符图像能够更好地表示出该缺损字符的字符轮廓。
步骤62:获取第m个候选补全字符的字符图像。其中,m为正整数,m≤M,M为正整数。
其中,“第m个候选补全字符的字符图像”用于表示该第m个候选补全字符的字符轮廓;而且本申请实施例不限定“第m个候选补全字符的字符图像”的确定过程,例如,其具体可以包括:将第m个候选补全字符进行图像转化处理,得到该第m个候选补全字符的字符图像。
需要说明的是,本申请实施例不限定“图像转化处理”的实施方式,例如,可以采用现有的或者未来出现的任一种能够将一个字符转化成一张图的方法进行实施。
步骤63:根据第m个候选补全字符的字符图像与缺损字符的字符图像之间的相似度,确定该第m个候选补全字符与缺损字符之间的相似度。其中,m为正整数,m≤M,M为正整数。
本申请实施例中,在获取到缺损字符的字符图像以及第m个候选补全字符的字符图像之后,可以先计算该第m个候选补全字符的字符图像与该缺损字符的字符图像之间的相似度,以使该相似度能够准确地表示出该第m个候选补全字符的字符轮廓与该缺损字符的字符轮廓之间的相似程度;再将该“第m个候选补全字符的字符图像与缺损字符的字符图像之间的相似度”,确定为该第m个候选补全字符与缺损字符之间的相似度,以使该相似度能够更准确地表示出利用该第m个候选补全字符替换该缺损字符的可能性。
基于上述步骤61至步骤63的相关内容可知,在一些情况下,可以参考各个候选补全字符的字符轮廓与该缺损字符的字符轮廓之间的相似程度,分别确定各个候选补全字符与缺损字符之间的相似度,以使各个候选补全字符与缺损字符之间的相似度分别能够更准确地表示出利用各个候选补全字符替换该缺损字符的可能性。
S41中“预设相似条件”可以预先设定;而且本申请实施例不限定“预设相似条件”,例如,其具体可以为:具有最大相似度的候选补全字符。可见,对于第m个候选补全字符来说,若该第m个候选补全字符与缺损字符之间的相似度大于上述“至少一个候选补全字符”中除了该第m个候选补全字符以外的其他任意一个候选补全字符与缺损字符之间的相似度,则确定该第m个候选补全字符满足预设相似条件,故可以将该第m个候选补全字符,确定为目标补全字符。
“目标补全字符”是指满足预设相似条件的候选补全字符。
基于上述S41的相关内容可知,在获取到至少一个候选补全字符之后,可以先计算各个候选补全字符与缺损字符之间的相似度;再参考这些相似度,从这些候选补全字符中确定满足预设相似条件的目标补全字符,以便后续能够利用该目标补全字符替换该缺损字符。
S42:利用目标补全字符替换图像识别文本中的缺损字符,得到待扫描对象的扫描识别文本。
基于上述S41至S42的相关内容可知,在获取到上述“扫描图像的图像识别文本”中缺损字符的至少一个候选补全字符之后,可以先从该至少一个候选补全字符中选择一个与该缺损字符最相似的候选补全字符;再利用该“与该缺损字符最相似的候选补全字符”替换图像识别文本中的缺损字符,得到待扫描对象的扫描识别文本,以使该扫描识别文本能够尽可能准确地表示出该待扫描对象中所记录的字符信息,如此有利于提高扫描识别文本的准确性。
基于上述S1至S4的相关内容可知,对于本申请实施例提供的扫描方法来说,在获取到针对待扫描对象的扫描图像之后,先确定该扫描图像中的缺损字符和该扫描图像的图像识别文本;再对该图像识别文本进行语义分析处理,得到待使用语义信息;然后,根据该待使用语义信息,确定该缺损字符的至少一个候选补全字符;最后,利用该至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的缺损字符,得到该待扫描对象的扫描识别文本,以使该扫描识别文本中不存在该缺损字符,如此能够有效地避免针对待扫描对象的扫描结果中出现不完整字符,从而能够提高扫描效果,进而能够提高用户扫描体验。
方法实施例二
在一些情况下,在获取到上述“待扫描对象的扫描识别文本”之后,还可以针对该“待扫描对象的扫描识别文本”进行一些其他处理。基于此,本申请实施例还提供了“扫描方法”的另一种可能的实施方式,其具体可以包括S5和/或S6:
S5:对上述“待扫描对象的扫描识别文本”进行显示处理。
其中,“显示处理”用于将上述“待扫描对象的扫描识别文本”显示给用户;而且本申请实施例不限定“显示处理”的实施方式,例如,当本申请实施例提供的“扫描方法”的执行主体为扫描设备时,该由该扫描设备直接显示上述“待扫描对象的扫描识别文本”即可。又如,当本申请实施例提供的“扫描方法”的执行主体为服务器时,可以先由服务器将上述“待扫描对象的扫描识别文本”发送给扫描设备;再由该扫描设备显示该“待扫描对象的扫描识别文本”。
S6:对上述“待扫描对象的扫描识别文本”进行预设文本处理,得到处理后文本,并对该处理后文本进行显示处理。
其中,“预设文本处理”用于针对一个文本数据进行处理;而且本申请实施例不限定“预设文本处理”,例如,其可以包括预设语言翻译处理(例如,英译汉处理、汉译英处理等)、同义词查找处理、近义词查找处理、反义词查找处理、古诗查找处理、或者字词解释处理等等。
另外,“预设文本处理”可以预先设定,也可以根据用户针对扫描设备的触控操作进行确定。其中,“触控操作”可以包括点击预设功能按钮。“预设功能按钮”用于触发预设功能(例如,预设语言翻译功能、同义词查找功能、近义词查找功能、反义词查找功能、古诗查找功能、或者字词解释功能等等)。
“处理后文本”是指针对上述“待扫描对象的扫描识别文本”进行预设文本处理的处理结果;而且本申请实施例不限定“处理后文本”,例如,该“处理后文本”可以是该“待扫描对象的扫描识别文本”的汉译英翻译结果、该“待扫描对象的扫描识别文本”的同义词查找结果、该“待扫描对象的扫描识别文本”的近义词查找处理、该“待扫描对象的扫描识别文本”的反义词查找结果、该“待扫描对象的扫描识别文本”的古诗查找结果、或者该“待扫描对象的扫描识别文本”的字词解释结果等等。
另外,“处理后文本”的显示处理过程类似于上文S5所示的“待扫描对象的扫描识别文本”的显示处理过程。
基于上述S5至S6的相关内容可知,在一些应用场景下,在获取到上述“待扫描对象的扫描识别文本”及其对应的处理后文本之后,可以将该“待扫描对象的扫描识别文本”及其对应的处理后文本显示给用户,以使用户能够在扫描设备上查看这些文本信息。
方法实施例三
在一些情况下,上述“扫描图像”中有可能存在多个缺损字符。此时,为了进一步提高扫描识别文本的准确性,本申请实施例还提供了“扫描方法”的又一种可能的实施方式,其具体可以包括步骤71-步骤74:
步骤71:在获取到针对待扫描对象的扫描图像之后,确定该扫描图像中的N个缺损字符和该扫描图像的图像识别文本。其中,N为正整数。
需要说明的是,第n个缺损字符的确定过程可以采用上文S1所示的“缺损字符的确定过程”的任一实施方式进行实施,只需将上文S1所示的“缺损字符的确定过程”的任一实施方式中“缺损字符”替换为“第n个缺损字符”即可。另外,“扫描图像的图像识别文本”的相关内容请参见上文步骤53所示的“扫描图像的图像识别文本”的相关内容。
步骤72:对扫描图像的图像识别文本进行语义分析处理,得到待使用语义信息。
需要说明的是,步骤72的相关内容请参见上文S2。
步骤73:根据待使用语义信息和第n个缺损字符的文本位置信息,确定该第n个缺损字符的至少一个候选补全字符。其中,n为正整数,n≤N。
其中,“第n个缺损字符的文本位置信息”用于表示该第n个缺损字符在上述“扫描图像的图像识别文本”中所处位置;而且本申请实施例不限定“第n个缺损字符的文本位置信息”,例如,其可以根据该第n个缺损字符的图像位置信息进行确定(例如,可以直接将第n个缺损字符的图像位置信息,确定为该第n个缺损字符的文本位置信息)。
需要说明的是,“第n个缺损字符的图像位置信息”的相关内容类似于上文步骤61所示的“缺损字符的图像位置信息”的相关内容,只需将上文步骤61所示的“缺损字符的图像位置信息”的相关内容中“缺损字符”替换为“第n个缺损字符”即可。
上述“第n个缺损字符的至少一个候选补全字符”是指能够在上述“扫描图像的图像识别文本”中代替该第n个缺损字符的至少一个字符;而且本申请实施例不限定“第n个缺损字符的至少一个候选补全字符”,例如,其可以包括能够表达出该第n个缺损字符的语义信息的至少一个字符。
另外,“第n个缺损字符的至少一个候选补全字符”的确定过程可以采用上文S3的任一实施方式进行实施,只需将上文S3的任一实施方式中“缺损字符”替换为“第n个缺损字符”、以及“待使用语义信息”替换为“待使用语义信息和第n个缺损字符的文本位置信息”即可。
步骤74:利用各个缺损字符的至少一个候选补全字符中的一个候选补全字符,分别替换图像识别文本中的各个缺损字符,得到待扫描对象的扫描识别文本。
本申请实施例中,在获取到第1个缺损字符的至少一个候选补全字符至第N个缺损字符的至少一个候选补全字符之后,可以利用第1个缺损字符的至少一个候选补全字符中的一个候选补全字符替换图像识别文本中的第1个缺损字符,利用第2个缺损字符的至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的第2个缺损字符,……(以此类推),利用第N个缺损字符的至少一个候选补全字符中的一个候选补全字符替换该图像识别文本中的第N个缺损字符,得到待扫描对象的扫描识别文本。
需要说明的是,步骤“利用第n个缺损字符的至少一个候选补全字符中的一个候选补全字符替换图像识别文本中的第n个缺损字符”可以采用上述步骤“利用至少一个候选补全字符中的一个候选补全字符替换图像识别文本中的缺损字符”的任一实施方式进行实施,只需将上述步骤“利用至少一个候选补全字符中的一个候选补全字符替换图像识别文本中的缺损字符”的任一实施方式中“至少一个候选补全字符”替换为“第n个缺损字符的至少一个候选补全字符”、以及“缺损字符”替换为“第n个缺损字符”即可。
基于上述步骤71至步骤74的相关内容可知,对于存在多个缺损字符的扫描图像来说,可以利用各个缺损字符的至少一个候选补全字符中的一个候选补全字符,分别替换图像识别文本中的各个缺损字符,得到待扫描对象的扫描识别文本,以使该扫描识别文本中不存在缺损字符,如此能够有效地避免针对待扫描对象的扫描结果中出现不完整字符,从而能够提高扫描效果,进而能够提高用户扫描体验。
基于上述方法实施例提供的扫描方法,本申请实施例还提供了一种扫描装置,下面结合附图进行解释和说明。
装置实施例
装置实施例对扫描装置进行介绍,相关内容请参见上述方法实施例。
参见图9,该图为本申请实施例提供的一种扫描装置的结构示意图。
本申请实施例提供的扫描装置900,包括:
第一确定单元901,用于在获取到针对待扫描对象的扫描图像之后,确定所述扫描图像中的缺损字符和所述扫描图像的图像识别文本;
语义分析单元902,用于对所述图像识别文本进行语义分析处理,得到待使用语义信息;
第二确定单元903,用于根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符;
字符替换单元904,用于利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
在一种可能的实施方式中,所述第一确定单元901,包括:
第一确定子单元,用于根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;
第二确定子单元,用于将所述设备扫描轨迹与所述理论扫描轨迹进行比较,得到扫描轨迹比较结果;
第三确定子单元,用于根据所述扫描轨迹比较结果,确定所述缺损字符。
在一种可能的实施方式中,所述设备扫描轨迹包括待使用字符的实际扫描边界位置;所述理论扫描轨迹包括所述待使用字符的理论扫描边界位置;
所述第三确定子单元,具体用于:若所述扫描轨迹比较结果表示所述待使用字符的实际扫描边界位置与所述待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,则将所述待使用字符确定为所述缺损字符。
在一种可能的实施方式中,所述扫描装置900还包括:
异常识别单元,用于对所述图像识别文本进行异常字符识别处理,得到异常字符识别结果;
所述第三确定子单元,具体用于:根据所述扫描轨迹比较结果和所述异常字符识别结果,确定所述缺损字符。
在一种可能的实施方式中,所述设备扫描轨迹包括待使用字符的实际扫描边界位置;所述理论扫描轨迹包括所述待使用字符的理论扫描边界位置;
所述第三确定子单元,具体用于:若所述扫描轨迹比较结果表示所述待使用字符的实际扫描边界位置与所述待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,或者所述异常字符识别结果表示所述待使用字符不是标准字符,则将所述待使用字符确定为所述缺损字符。
在一种可能的实施方式中,所述第一确定单元901,包括:
第一确定子单元,用于根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;
图像裁剪子单元,用于按照所述理论扫描轨迹,对所述扫描图像进行裁剪处理,得到待使用图像;
字符识别子单元,用于对所述待使用图像进行字符识别处理,得到所述图像识别文本。
在一种可能的实施方式中,所述字符替换单元904,具体用于:根据各个所述候选补全字符与所述缺损字符之间的相似度,从所述至少一个候选补全字符中确定满足预设相似条件的目标补全字符;利用所述目标补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
在一种可能的实施方式中,所述候选补全字符的个数为M,且第m个候选补全字符与所述缺损字符之间的相似度的确定过程,包括:获取所述缺损字符的字符图像和所述第m个候选补全字符的字符图像;根据所述第m个候选补全字符的字符图像与所述缺损字符的字符图像之间的相似度,确定所述第m个候选补全字符与所述缺损字符之间的相似度;其中,m为正整数,m≤M,M为正整数。
在一种可能的实施方式中,所述缺损字符的字符图像的获取过程,包括:按照所述缺损字符的图像位置信息,从所述扫描图像中截取所述缺损字符的字符图像;
在一种可能的实施方式中,所述缺损字符的字符图像的获取过程,包括:根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;按照所述理论扫描轨迹,对所述扫描图像进行裁剪处理,得到待使用图像;按照所述缺损字符的图像位置信息,从所述待使用图像中截取所述缺损字符的字符图像。
在一种可能的实施方式中,所述第一确定单元901,具体用于:在获取到针对待扫描对象的扫描图像之后,确定所述扫描图像中的多个缺损字符和所述扫描图像的图像识别文本;
所述第二确定单元903,具体用于:根据所述待使用语义信息和各个所述缺损字符的文本位置信息,分别确定各个所述缺损字符的至少一个候选补全字符;
所述字符替换单元904,具体用于:利用各个所述缺损字符的至少一个候选补全字符中的一个候选补全字符,分别替换所述图像识别文本中的各个所述缺损字符,得到所述待扫描对象的扫描识别文本。
在一种可能的实施方式中,所述扫描装置900还包括:
第一显示单元,用于对所述扫描识别文本进行显示处理;
和/或,
第二显示单元,用于对所述扫描识别文本进行预设文本处理,得到处理后文本;对所述处理后文本进行显示处理。
进一步地,本申请实施例还提供了一种扫描设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述扫描方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述扫描方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行上述扫描方法的任一种实现方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种扫描方法,其特征在于,所述方法包括:
在获取到针对待扫描对象的扫描图像之后,确定所述扫描图像中的缺损字符和所述扫描图像的图像识别文本;
对所述图像识别文本进行语义分析处理,得到待使用语义信息;
根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符;
利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
2.根据权利要求1所述的方法,其特征在于,所述缺损字符的确定过程,包括:
根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;
将所述设备扫描轨迹与所述理论扫描轨迹进行比较,得到扫描轨迹比较结果;
根据所述扫描轨迹比较结果,确定所述缺损字符。
3.根据权利要求2所述的方法,其特征在于,所述设备扫描轨迹包括待使用字符的实际扫描边界位置;所述理论扫描轨迹包括所述待使用字符的理论扫描边界位置;
所述根据所述扫描轨迹比较结果,确定所述缺损字符,包括:
若所述扫描轨迹比较结果表示所述待使用字符的实际扫描边界位置与所述待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,则将所述待使用字符确定为所述缺损字符。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对所述图像识别文本进行异常字符识别处理,得到异常字符识别结果;
所述根据所述扫描轨迹比较结果,确定所述缺损字符,包括:
根据所述扫描轨迹比较结果和所述异常字符识别结果,确定所述缺损字符。
5.根据权利要求4所述的方法,其特征在于,所述设备扫描轨迹包括待使用字符的实际扫描边界位置;所述理论扫描轨迹包括所述待使用字符的理论扫描边界位置;
所述根据所述扫描轨迹比较结果和所述异常字符识别结果,确定所述缺损字符,包括:
若所述扫描轨迹比较结果表示所述待使用字符的实际扫描边界位置与所述待使用字符的理论扫描边界位置之间的相对关系满足预设位置条件,或者所述异常字符识别结果表示所述待使用字符不是标准字符,则将所述待使用字符确定为所述缺损字符。
6.根据权利要求1所述的方法,其特征在于,所述图像识别文本的确定过程,包括:
根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;
按照所述理论扫描轨迹,对所述扫描图像进行裁剪处理,得到待使用图像;
对所述待使用图像进行字符识别处理,得到所述图像识别文本。
7.根据权利要求1所述的方法,其特征在于,所述扫描识别文本的确定过程,包括:
根据各个所述候选补全字符与所述缺损字符之间的相似度,从所述至少一个候选补全字符中确定满足预设相似条件的目标补全字符;
利用所述目标补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
8.根据权利要求7所述的方法,其特征在于,所述候选补全字符的个数为M,且第m个候选补全字符与所述缺损字符之间的相似度的确定过程,包括:
获取所述缺损字符的字符图像和所述第m个候选补全字符的字符图像;其中,m为正整数,m≤M,M为正整数;
根据所述第m个候选补全字符的字符图像与所述缺损字符的字符图像之间的相似度,确定所述第m个候选补全字符与所述缺损字符之间的相似度。
9.根据权利要求8所述的方法,其特征在于,所述缺损字符的字符图像的获取过程,包括:
按照所述缺损字符的图像位置信息,从所述扫描图像中截取所述缺损字符的字符图像;
或者,
所述缺损字符的字符图像的获取过程,包括:
根据所述扫描图像的设备扫描轨迹,确定所述扫描图像的理论扫描轨迹;按照所述理论扫描轨迹,对所述扫描图像进行裁剪处理,得到待使用图像;按照所述缺损字符的图像位置信息,从所述待使用图像中截取所述缺损字符的字符图像。
10.根据权利要求1所述的方法,其特征在于,所述确定所述扫描图像中的缺损字符,包括:
确定所述扫描图像中的多个缺损字符;
所述根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符,包括:
根据所述待使用语义信息和各个所述缺损字符的文本位置信息,分别确定各个所述缺损字符的至少一个候选补全字符;
所述利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本,包括:
利用各个所述缺损字符的至少一个候选补全字符中的一个候选补全字符,分别替换所述图像识别文本中的各个所述缺损字符,得到所述待扫描对象的扫描识别文本。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述扫描识别文本进行显示处理;
和/或,
对所述扫描识别文本进行预设文本处理,得到处理后文本;对所述处理后文本进行显示处理。
12.一种扫描装置,其特征在于,包括:
第一确定单元,用于在获取到针对待扫描对象的扫描图像之后,确定所述扫描图像中的缺损字符和所述扫描图像的图像识别文本;
语义分析单元,用于对所述图像识别文本进行语义分析处理,得到待使用语义信息;
第二确定单元,用于根据所述待使用语义信息,确定所述缺损字符的至少一个候选补全字符;
字符替换单元,用于利用所述至少一个候选补全字符中的一个候选补全字符替换所述图像识别文本中的缺损字符,得到所述待扫描对象的扫描识别文本。
13.一种设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1至11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1至11任一项所述的方法。
15.一种计算机程序产品,其特征在于,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行权利要求1至11任一项所述的方法。
CN202111033580.0A 2021-09-03 2021-09-03 一种扫描方法及其相关设备 Active CN113723420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111033580.0A CN113723420B (zh) 2021-09-03 2021-09-03 一种扫描方法及其相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111033580.0A CN113723420B (zh) 2021-09-03 2021-09-03 一种扫描方法及其相关设备

Publications (2)

Publication Number Publication Date
CN113723420A true CN113723420A (zh) 2021-11-30
CN113723420B CN113723420B (zh) 2024-07-02

Family

ID=78681637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111033580.0A Active CN113723420B (zh) 2021-09-03 2021-09-03 一种扫描方法及其相关设备

Country Status (1)

Country Link
CN (1) CN113723420B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116630982A (zh) * 2023-05-16 2023-08-22 读书郎教育科技有限公司 基于ai词典笔的扫描区域定位方法
CN117636376A (zh) * 2024-01-23 2024-03-01 长沙枫树林电子科技有限公司 电磁原笔迹签批方法及终端

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07239908A (ja) * 1994-02-25 1995-09-12 Mitsubishi Electric Corp 文字認識装置
JPH08272902A (ja) * 1995-04-03 1996-10-18 Fuji Electric Co Ltd 異字体異品質文字の認識方法
US5748807A (en) * 1992-10-09 1998-05-05 Panasonic Technologies, Inc. Method and means for enhancing optical character recognition of printed documents
US6577755B1 (en) * 1994-10-18 2003-06-10 International Business Machines Corporation Optical character recognition system having context analyzer
KR20070067753A (ko) * 2005-12-23 2007-06-29 삼성전자주식회사 문자 복구 기능을 갖는 화상형성장치 및 그 방법
CN108229462A (zh) * 2018-01-22 2018-06-29 维沃移动通信有限公司 一种缺损内容的确定方法和移动终端
CN110502655A (zh) * 2019-07-31 2019-11-26 武汉大学 一种嵌入场景文字信息的图像自然描述语句生成方法
CN209784982U (zh) * 2019-05-20 2019-12-13 鲁伯特(北京)教育科技有限公司 一种手写板页码识别及书写轨迹校正装置
WO2020022574A1 (en) * 2018-07-23 2020-01-30 Hewlett-Packard Development Company, L. P. Character recognition using previous recognition result of similar character
CN212519117U (zh) * 2020-07-13 2021-02-09 安徽淘云科技有限公司 扫描设备
CN112364837A (zh) * 2020-12-09 2021-02-12 四川长虹电器股份有限公司 一种基于目标检测和文本识别的票据信息识别方法
CN112966583A (zh) * 2021-02-26 2021-06-15 深圳壹账通智能科技有限公司 图像处理方法、装置、计算机设备和存储介质
CN113313064A (zh) * 2021-06-23 2021-08-27 北京有竹居网络技术有限公司 字符识别方法、装置、可读介质及电子设备

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748807A (en) * 1992-10-09 1998-05-05 Panasonic Technologies, Inc. Method and means for enhancing optical character recognition of printed documents
JPH07239908A (ja) * 1994-02-25 1995-09-12 Mitsubishi Electric Corp 文字認識装置
US6577755B1 (en) * 1994-10-18 2003-06-10 International Business Machines Corporation Optical character recognition system having context analyzer
JPH08272902A (ja) * 1995-04-03 1996-10-18 Fuji Electric Co Ltd 異字体異品質文字の認識方法
KR20070067753A (ko) * 2005-12-23 2007-06-29 삼성전자주식회사 문자 복구 기능을 갖는 화상형성장치 및 그 방법
CN108229462A (zh) * 2018-01-22 2018-06-29 维沃移动通信有限公司 一种缺损内容的确定方法和移动终端
WO2020022574A1 (en) * 2018-07-23 2020-01-30 Hewlett-Packard Development Company, L. P. Character recognition using previous recognition result of similar character
CN209784982U (zh) * 2019-05-20 2019-12-13 鲁伯特(北京)教育科技有限公司 一种手写板页码识别及书写轨迹校正装置
CN110502655A (zh) * 2019-07-31 2019-11-26 武汉大学 一种嵌入场景文字信息的图像自然描述语句生成方法
CN212519117U (zh) * 2020-07-13 2021-02-09 安徽淘云科技有限公司 扫描设备
CN112364837A (zh) * 2020-12-09 2021-02-12 四川长虹电器股份有限公司 一种基于目标检测和文本识别的票据信息识别方法
CN112966583A (zh) * 2021-02-26 2021-06-15 深圳壹账通智能科技有限公司 图像处理方法、装置、计算机设备和存储介质
CN113313064A (zh) * 2021-06-23 2021-08-27 北京有竹居网络技术有限公司 字符识别方法、装置、可读介质及电子设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘成林;: "文档图像识别技术回顾与展望", 数据与计算发展前沿, no. 06, 15 December 2019 (2019-12-15) *
张习文, 欧宗瑛: "基于单义域邻接图的工程图纸扫描图像的字符提取", 工程图学学报, no. 02, 30 June 2000 (2000-06-30) *
李佐, 王姝华, 蔡士杰: "一种基于前端预测识别的粘连字符分割方法", 计算机研究与发展, no. 11, 15 November 2001 (2001-11-15) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116630982A (zh) * 2023-05-16 2023-08-22 读书郎教育科技有限公司 基于ai词典笔的扫描区域定位方法
CN117636376A (zh) * 2024-01-23 2024-03-01 长沙枫树林电子科技有限公司 电磁原笔迹签批方法及终端
CN117636376B (zh) * 2024-01-23 2024-05-28 长沙枫树林电子科技有限公司 电磁原笔迹签批方法及终端

Also Published As

Publication number Publication date
CN113723420B (zh) 2024-07-02

Similar Documents

Publication Publication Date Title
CN111753767B (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
JP6831480B2 (ja) テキスト検出分析方法、装置及びデバイス
TWI321294B (en) Method and device for determining at least one recognition candidate for a handwritten pattern
CN110225387A (zh) 一种信息搜索方法、装置及电子设备
RU2666277C1 (ru) Сегментация текста
CN111507330B (zh) 习题识别方法、装置、电子设备及存储介质
CN113723420A (zh) 一种扫描方法及其相关设备
US20160140389A1 (en) Information extraction supporting apparatus and method
CN111581367A (zh) 一种题目录入的方法和系统
CN110597965B (zh) 文章的情感极性分析方法、装置、电子设备及存储介质
CN116501960B (zh) 内容检索方法、装置、设备及介质
CN113033711A (zh) 题目批改方法、装置、电子设备及计算机存储介质
US20230008529A1 (en) Gesture stroke recognition in touch-based user interface input
CN110781874A (zh) 一种将电子菜谱转化为炒菜机菜谱的方法及菜谱制作终端
CN110647885A (zh) 基于图片识别的试卷拆分方法、装置、设备以及介质
CN112560849A (zh) 基于神经网络算法的文理分割方法及系统
US9659224B1 (en) Merging optical character recognized text from frames of image data
US11379527B2 (en) Sibling search queries
US9934449B2 (en) Methods and systems for detecting topic transitions in a multimedia content
JP5694236B2 (ja) 文書検索装置、方法およびプログラム
CN110795918A (zh) 确定阅读位置的方法、装置及设备
CN113641837A (zh) 一种展示方法及其相关设备
KR20220005243A (ko) 수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치
CN109635798B (zh) 一种信息提取方法及装置
CN110895924B (zh) 一种文档内容朗读方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant