CN111931828B - 一种信息确定方法、电子设备和计算机可读存储介质 - Google Patents
一种信息确定方法、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN111931828B CN111931828B CN202010718608.3A CN202010718608A CN111931828B CN 111931828 B CN111931828 B CN 111931828B CN 202010718608 A CN202010718608 A CN 202010718608A CN 111931828 B CN111931828 B CN 111931828B
- Authority
- CN
- China
- Prior art keywords
- information
- piece
- processed
- acquiring
- screened
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000002159 abnormal effect Effects 0.000 claims abstract description 65
- 230000015654 memory Effects 0.000 claims description 31
- 238000012986 modification Methods 0.000 claims description 23
- 230000004048 modification Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 9
- 238000012015 optical character recognition Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- 230000005291 magnetic effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明实施例公开了一种信息确定方法,该方法包括:获取待处理信息中每一信息的置信度;其中,所述待处理信息为与模板信息匹配的手写文本信息;获取所述待处理信息中组成每一信息的每一字符的痕迹参数;其中,所述痕迹参数表征所述每一字符在手写完成后呈现的状态;基于所述痕迹参数和所述置信度,从所述待处理信息中确定异常信息。本发明实施例同时还公开了一种电子设备和计算机存储介质。
Description
技术领域
本发明涉及智慧教育领域,尤其是涉及一种信息确定方法、电子设备和计算机可读存储介质。
背景技术
在考试过程中,普遍存在考生因记不清具体内容而进行模糊拼写,以希望在阅卷过程中可以将其模糊拼写的内容识别为正确内容。然而,相关技术中针对考生答复的试卷内容通常给出的结果只是对和错,这样会存在考生猜测撰写或模糊拼写的内容被识别为正确内容的问题。
发明内容
为解决上述技术问题,本发明实施例期望提供一种信息确定方法、电子设备和计算机存储介质,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
为达到上述目的,本发明的技术方案是这样实现的:
一种信息确定方法,所述方法包括:
获取待处理信息中每一信息的置信度;其中,所述待处理信息为与模板信息匹配的手写文本信息;
获取所述待处理信息中组成每一信息的每一字符的痕迹参数;其中,所述痕迹参数表征所述每一字符在手写完成后呈现的状态;
基于所述痕迹参数和所述置信度,从所述待处理信息中确定异常信息。
可选地,所述获取待处理信息中每一信息的置信度,包括:
对所述待处理信息中的每一信息进行识别,并将识别结果和所述模板信息进行匹配;
基于匹配结果,获取所述待处理信息中每一信息的置信度。
可选地,所述基于匹配结果,获取所述待处理信息中每一信息的置信度,包括:
基于所述匹配结果,确定所述待处理信息中每一信息对应所述模板信息中每一信息的置信区间;
基于所述置信区间,获取所述待处理信息中每一信息的置信度。
可选地,所述基于所述痕迹参数和所述置信度,从所述待处理信息中确定异常信息,包括:
基于所述置信度,从所述待处理信息中确定参考信息;
确定所述参考信息中组成每一信息的每一字符的痕迹参数;
基于所述参考信息中组成每一信息的每一字符的痕迹参数,从所述参考信息中确定所述异常信息。
可选地,所述基于所述参考信息中组成每一信息的每一字符的痕迹参数,从所述参考信息中确定所述异常信息,包括:
基于所述痕迹参数,从所述参考信息中确定待筛选信息;
获取每一待筛选信息对应的目标文本信息的第一轨迹参数和所述每一待筛选信息的第二轨迹参数;其中,所述目标文本信息与所述待筛选信息具有关联关系;
基于所述第一轨迹参数和所述第二轨迹参数,从所述待筛选信息中确定所述异常信息。
可选地,所述基于所述第一轨迹参数和所述第二轨迹参数,从所述待筛选信息中确定所述异常信息,包括:
对每一所述待筛选信息的所述第一轨迹参数和所述第二轨迹参数进行一致性匹配,获得匹配结果;
基于所述匹配结果,从所述待筛选信息中确定所述异常信息。
可选地,所述基于所述参考信息中组成每一信息的每一字符的痕迹参数,从所述参考信息中确定所述异常信息,包括:
获取所述参考信息中,每一信息对应的区域内与所述每一信息相关联的修改参数;
从所述参考信息中,确定所述修改参数满足预设修改条件且所述痕迹参数符合撰写异常条件的信息为所述异常信息。
可选地,所述获取待处理信息中每一信息的置信度之前,所述方法还包括:
获取所述手写文本信息;
从所述手写文本信息中获取与所述模板信息匹配的信息,得到所述待处理信息。
一种电子设备,所述电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中的信息确定方法的程序,以实现以下步骤:
获取待处理信息中每一信息的置信度;其中,所述待处理信息为与模板信息匹配的手写文本信息;
获取所述待处理信息中组成每一信息的每一字符的痕迹参数;其中,所述痕迹参数表征所述每一字符在手写完成后呈现的状态;
基于所述痕迹参数和所述置信度,从所述待处理信息中确定异常信息。
一种信息确定装置,所述信息确定装置包括:第一获取单元、第二获取单元和处理单元;
第一获取单元,用于获取待处理信息中每一信息的置信度;其中,所述待处理信息为与模板信息匹配的手写文本信息;
第二获取单元,用于获取所述待处理信息中组成每一信息的每一字符的痕迹参数;其中,所述痕迹参数表征所述每一字符在手写完成后呈现的状态;
处理单元,用于基于所述痕迹参数和所述置信度,从所述待处理信息中确定异常信息。
一种计算机可读存储介质,所述计算机可读存储介质有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述的信息确定方法的步骤。
本发明实施例所提供的信息确定方法、电子设备、信息确定装置和计算机可读存储介质,获取待处理信息中每一信息的置信度;其中,待处理信息为与模板信息匹配的手写文本信息;获取待处理信息中组成每一信息的每一字符的痕迹参数;其中,痕迹参数表征每一字符在手写完成后呈现的状态;基于痕迹参数和置信度,从待处理信息中确定异常信息;如此,直接通过获取与模板信息匹配的手写文本信息中每一信息的置信度,以及组成每一信息的每一字符的痕迹参数,来确定出异常信息,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
附图说明
图1为本发明实施例提供的一种信息确定方法的流程示意图;
图2为本发明实施例提供的另一种信息确定方法的流程示意图;
图3为本发明实施例提供的又一种信息确定方法的流程示意图;
图4为本发明实施例提供的一种通过OCR已识别为正确的手写内容中确定出置信度较低的单词的流程示意图;
图5为本发明实施例提供的一种电子设备的结构示意图;
图6为本发明实施例提供的一种信息确定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
应理解,说明书通篇中提到的“本发明实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“本发明实施例中”或“在前述实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中应。在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在未做特殊说明的情况下,电子设备执行本发明实施例中的任一步骤,可以是电子设备的处理器执行该步骤。还值得注意的是,本发明实施例并不限定电子设备执行下述步骤的先后顺序。另外,不同实施例中对数据进行处理所采用的方式可以是相同的方法或不同的方法。还需说明的是,本发明实施例中的任一步骤是电子设备可以独立执行的,即电子设备执行下述实施例中的任一步骤时,可以不依赖于其它步骤的执行。
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种信息确定方法,应用于电子设备,如图1所示,该方法包括以下步骤:
步骤101、获取待处理信息中每一信息的置信度。
其中,待处理信息为与模板信息匹配的手写文本信息。
在本发明实施例中,手写文本信息可以是用户在纸面上通过手写获得的具体信息,也可以是用户在手写电子显示屏上通过手写获得具体信息,本申请对在何种介质上通过手写来获得手写文本信息不作任何限定。
在本发明实施例中,模板信息可以是由电子设备提供的具有固定格式/形式的且呈现出一定内容的信息;其中,模板信息可以是包括但不限于以下形式的信息,如:词组或单词、一句话、一段话或一个篇章等,模板信息更可以包括数字、运算符号、标点符合和其他符号等,本申请对此不作任何限定。
其中,电子设备通过获取任一介质上有关用户通过手写完成的手写文本信息,并将其与模板信息进行相关匹配处理,来获取待处理信息。在一种可行的实现方式中,电子设备将该手写文本信息与该模板信息按照书写内容完全一致性的原则进行匹配处理,来获取待处理信息。本申请对基于何种原则对手写文本信息与模板信息进行匹配不作任何限定。
需要说明的是,置信度是在统计学中与置信区间对应的一个概念,而一个概率样本的置信区间是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,置信区间给出的是被测量参数的测量值的可信程度,而上述提到的“一定概率”即为置信水平,也就是为置信度,在一种可行的实施方式中,置信度的值一般设定为95%。
在本发明实施例中,待处理信息中每一信息的置信度,可以是电子设备将待处理信息与模板信息进行相似度匹配处理得到的置信度,也可以是电子设备在预设周期内将待处理信息与模板信息进行相似度匹配处理得到的置信度。
步骤102、获取待处理信息中组成每一信息的每一字符的痕迹参数。
其中,痕迹参数表征每一字符在手写完成后呈现的状态。
在本发明实施例中,待处理信息中组成每一信息的每一字符可以是任一数字、任一字母、任一运算符号、标点符号或其他符号等,本申请对组成每一信息中的字符的具体形式不作任何限定。
其中,每一字符是组成每一信息的最小元素;在一种可行的实现方式中,信息为英文单词,如:hello,其对应的每一字符即为:h、e、l、l、o。
在本发明实施例中,每一字符的痕迹参数为每一字符在手写完成后呈现出的状态;其中,每一字符在手写完成后呈现的状态包括但不限于以下信息,如:每一字符的手写工整程度、每一字符的手写清晰程度、每一字符在书写完成后呈现的涂鸦和/或修改痕迹、每一字符的下笔轻重痕迹、每一字符的轨迹痕迹等;其中,每一字符的痕迹参数可以是上述提到的全部参数信息的组合,也可以是上述提到多种参数信息任意组合,也可以是上述提到的全部参数信息的任意一种。本申请对此不作任何限定。
需要说明的是,每一信息的痕迹参数是组成每一信息的每一字符的痕迹参数的全部集合。
步骤103、基于痕迹参数和置信度,从待处理信息中确定异常信息。
在本发明实施例中,电子设备通过组成每一信息的每一字符的痕迹参数以及每一信息对应的置信度,从待处理信息中筛选出异常信息;在一种可行的实现方式中,电子设备可以通过设置一置信度阈值,通过对待处理信息中每一信息的置信度与置信度阈值进行比对,再根据组成每一信息的每一字符的痕迹参数,从待处理信息中确定并筛选出异常信息;在另一种可行的实现方式中,电子设备还可以对组成每一信息的每一字符的痕迹参数,以及每一信息的置信度分别设定权重值,再通过组成每一信息的每一字符的痕迹参数、痕迹参数对应的权重值、每一信息的置信度和每一信息的置信度对应的权重值,从待处理信息中确定并筛选出异常信息。
需要说明的是,异常信息是已被电子设备识别为与模板信息匹配的手写文本信息,在一种可行的实现方式中,异常信息是待处理信息中手写模糊或不清晰的手写文本信息;在另一种可行的实现方式中,异常信息是具有多次涂鸦和/或修改痕迹的手写文本信息;在又一种可行的实现方式中,异常信息是手写不规范和/或撰写不工整的手写文本信息,本申请对此不作任何限定。
其中,电子设备在确定出异常信息后,还可以根据预设策略对该异常信息进行分类,如按照确定出的异常信息的置信度,对其进行分类,例如可以分类为书写不熟悉的信息、书写不规范的信息、没有掌握但蒙对的信息等等。
本发明实施例所提供的信息确定方法,获取待处理信息中每一信息的置信度;其中,待处理信息为与模板信息匹配的手写文本信息;获取待处理信息中组成每一信息的每一字符的痕迹参数;其中,痕迹参数表征每一字符在手写完成后呈现的状态;基于痕迹参数和置信度,从待处理信息中确定异常信息;如此,直接通过获取与模板信息匹配的手写文本信息中每一信息的置信度,以及组成每一信息的每一字符的痕迹参数,来确定出异常信息,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
基于前述实施例,本发明实施例提供一种信息确定方法,如图2所示,该方法包括以下步骤:
步骤201、电子设备对待处理信息中的每一信息进行识别,并将识别结果和模板信息进行匹配。
在本发明实施例中,电子设备将待处理信息中每一信息与在模板信息中相对应的每一信息进行匹配;在一种可行的实现方式中,电子设备可以将待处理信息中每一信息与在模板信息相对应的每一信息进行相似度匹配,其中,可以是根据信息的表述内容相似度进行匹配。本申请对进行何种匹配不作任何限定。
步骤202、电子设备基于匹配结果,获取待处理信息中每一信息的置信度。
在本发明实施例中,电子设备通过待处理信息中每一信息与在模板信息中相对应的每一信息进行匹配得到的匹配结果,来获取待处理信息中每一信息对应的置信度,其中,待处理信息中每一信息的置信度可以通过数值进行表示,每一信息的置信度的数值小于等于1,且置信度的数值可以是以百分数进行表示,也可以是以浮点数进行表示,本申请对此不作任何限定。
在一种可行的实现方式中,电子设备执行步骤202时还可以通过以下步骤202a至步骤202b的方式实现:
步骤202a、电子设备基于匹配结果,确定待处理信息中每一信息对应模板信息中每一信息的置信区间。
在本发明实施例中,电子设备通过上述得到的匹配结果来确定相应的置信区间;在一种可行的实现方式中,电子设备根据待处理信息中每一信息识别为模板信息中相对应的每一信息的概率值大小的结果,计算并确定出待处理信息中每一信息对应的模板信息中每一信息的置信区间。
需要说明的是,置信区间是由样本统计量所构造的总体参数的估计区间,常用于统计学中,且一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。且置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。
步骤202b、电子设备基于置信区间,获取待处理信息中每一信息的置信度。
其中,待处理信息为与模板信息匹配的手写文本信息。
在本发明实施例中,电子设备通过上文确定的每一信息对应的置信区间,来计算并获取待处理中每一信息的置信度,其中,置信度与置信区间是相对应的两个参数,例如,置信区间范围越广,其对应的置信度的数值也越大。
步骤203、电子设备获取待处理信息中组成每一信息的每一字符的痕迹参数。
其中,痕迹参数表征每一字符在手写完成后呈现的状态。
步骤204、电子设备基于痕迹参数和置信度,从待处理信息中确定异常信息。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
本发明实施例所提供的信息确定方法,电子设备直接通过获取与模板信息匹配的手写文本信息中每一信息的置信度,以及组成每一信息的每一字符的痕迹参数,来确定出异常信息,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
基于前述实施例,本发明的实施例还提供一种信息确定方法,如图3所示,该方法包括以下步骤:
步骤301、电子设备对待处理信息中的每一信息进行识别,并将识别结果和模板信息进行匹配。
步骤302、电子设备基于匹配结果,获取待处理信息中每一信息的置信度。
其中,待处理信息为与模板信息匹配的手写文本信息。
步骤303、电子设备获取待处理信息中组成每一信息的每一字符的痕迹参数。
其中,痕迹参数表征每一字符在手写完成后呈现的状态。
步骤304、电子设备基于置信度,从待处理信息中确定参考信息。
在本发明实施例中,电子设备获取并根据待处理信息中每一信息的置信度,从待处理信息中筛选并确定出参考信息;在一种可行的实现方式中,电子设备可以设置一置信度阈值,如95%,通过待处理信息中每一信息的置信度值与置信度阈值进行比对,从待处理信息中筛选并确定出置信度的值低于95%的信息为参考信息。
步骤305、电子设备确定参考信息中组成每一信息的每一字符的痕迹参数。
在本发明实施例中,电子设备获取并确定参考信息中组成每一信息的每一字符的痕迹参数,其中,对于如何获取参考信息中组成每一信息的每一字符的痕迹参数本申请不作任何限定。
其中,参考信息中组成每一信息的每一字符的痕迹参数如上文提到,可以是每一字符的手写工整程度、每一字符的手写清晰程度、每一字符在书写过程中存在的涂鸦和\或修改痕迹、每一字符的下笔轻重痕迹、每一字符的轨迹痕迹等。
步骤306、电子设备基于参考信息中组成每一信息的每一字符的痕迹参数,从参考信息中确定异常信息。
在本发明实施例中,电子设备基于置信度从待处理信息中筛选并确定出参考信息,再基于参考信息中组成每一信息的每一字符的痕迹参数,从参考信息中筛选并确定出异常信息,其中,异常信息可以是置信度低于置信度阈值且痕迹参数满足预设条件的待处理信息;在一种可行的实现方式中,电子设备可以是将参考信息中组成每一信息的每一字符的痕迹参数满足预设条件的信息确定为异常信息,其中,每一字符的痕迹参数满足预设条件可以是每一字符的手写工整程度满足一定预设条件,也可以是每一字符的手写清晰程度满足一定预设条件,更可以是每一字符的下笔轻重痕迹满足一定预设条件等,还可以是上述多种情况的任意组合,更可以是包括但不限于上述多种情况的组合。本申请对此不作任何限定。
在一种可行的实现方式中,电子设备执行步骤306时还可以通过步骤A1至步骤A3的方式来实现:
步骤A1、电子设备基于痕迹参数,从参考信息中确定待筛选信息。
在本发明实施例中,电子设备可以在参考信息中组成每一信息的每一字符的痕迹参数满足一定预设条件的情况下,从参考信息中确定出待筛选信息。
步骤A2、电子设备获取每一待筛选信息对应的目标文本信息的第一轨迹参数和每一待筛选信息的第二轨迹参数。
其中,目标文本信息与待筛选信息具有关联关系。
在本发明实施例中,每一待筛选信息对应的目标文本信息是与待筛选信息具有一定关联关系的信息;其中,关联关系具体可以每一待筛选信息与目标文本信息在特定区域的关联关系,更可以是每一待筛选信息与目标文本信息在内容上的关联关系;在一种可行的实现方式中,目标文本信息可以是与每一待筛选信息在相关内容上对应的上文手写文本信息或下文手写文本信息,更可以是与每一待筛选信息在相关内容上对应的上下文手写文本信息。
在一种可行的实现方式中,电子设备可以获取的是目标文本信息对应的目标区域的手写痕迹参数,以及每一待筛选信息对应的区域的手写痕迹参数。
步骤A3、电子设备基于第一轨迹参数和第二轨迹参数,从待筛选信息中确定异常信息。
在一种可行的实现方式中,电子设备执行步骤A3时还可以通过步骤A31至步骤A32的方式来实现:
步骤A31、电子设备对每一待筛选信息的第一轨迹参数和第二轨迹参数进行一致性匹配,获得匹配结果。
在本发明实施例中,第一轨迹参数和第二轨迹参数是互相对应的,在一种可行的实现方式中,第一轨迹参数和第二轨迹参数分别是用户手写完成目标文本信息后呈现的书写风格参数、以及用户手写完成每一待筛选信息后呈现的书写风格参数。
其中,电子设备将目标文本信息对应的书写风格参数和每一待筛选信息对应的书写风格参数进行一致性匹配,得到相对应的匹配结果;在一种可行的实现方式中,电子设备将目标文本信息的书写风格参数与对应的待筛选信息的书写风格参数按照书写风格参数一致性的原则进行匹配,得到匹配度为70%的结果。
步骤A32、电子设备基于匹配结果,从待筛选信息中确定异常信息。
在本发明实施例中,电子设备可以根据上述的两种书写风格参数进行一致性匹配后得到的结果,从待筛选信息中筛选并确定出异常信息;其中,电子设备可以按照匹配结果的数值从待筛选信息中确定异常信息,如设置匹配阈值为90%,匹配结果低于90%的话,则确定进行匹配的待筛选信息为异常信息。
在一种可行的实现方式中,电子设备执行步骤306时还可以通过步骤B1至步骤B2的方式来实现:
步骤B1、电子设备获取参考信息中,每一信息对应的区域内与每一信息相关联的修改参数。
在本发明实施例中,电子设备获取参考信息中每一信息对应的区域,在一种可行的实现方式中,每一信息对应的区域是参考信息中每一信息对应的书写区域。
其中,获取与参考信息中每一信息相关联的修改参数,可以是与参考信息中每一信息相关联的涂鸦参数,更可以是与参考信息中每一信息相关联的修订信息,本申请对此不作任何限定。
步骤B2、电子设备从参考信息中,确定修改参数满足预设修改条件且痕迹参数符合撰写异常条件的信息为异常信息。
在本发明实施例中,电子设备可以是将参考信息中每一信息对应的修改参数满足预设修改条件的,且参考信息中组成每一信息的每一字符的痕迹参数符合撰写异常条件的信息,确定为异常信息;其中,预设修改条件可以是每一信息对应的修改痕迹次数超过某一特定数值,如3、5等,本申请对此不作任何限定;同时撰写异常条件可以是信息在手写完成后呈现的下笔痕迹轻重不一致、手写字迹模糊/不清晰等条件,本申请对此也不做任何限定。
需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。
基于前述实施例,在本发明的其他实施例中,电子设备获取待处理信息中每一信息的置信度之前,即在步骤101、步骤201和步骤301之前,还可以执行以下步骤C1至步骤C2:
步骤C1、电子设备获取手写文本信息。
在本发明实施例中,电子设备获取用户在纸面上或手写电子显示上通过手写完成的手写文本信息;其中,手写文本信息可以是包括但不限于以下形式的信息,如:词组或单词、一句话、一段话或一个篇章等;在一种可行的实现方式中,手写文本信息可以是考生通过手写完成一套试卷后产生的手写文本信息。
步骤C2、电子设备从手写文本信息中获取与模板信息匹配的信息,得到待处理信息。
在本发明其他实施例中,电子设备将已获取的模板信息与手写文本信息进行匹配,来得到待处理信息,其中,电子设备可以通过光学字符识别(Optical CharacterRecognition,OCR)技术对模板信息与用户通过手写完成手写文本信息进行匹配来得到待处理信息,更可以通过特定的文字识别应用程序来进行匹配识别。
如图4所示,给出了一种通过OCR已识别为正确的手写内容中确定出置信度较低的单词的流程示意图。电子设备首先获取学生手写体,即获取学生手写的具体内容;通过OCR技术对其进行识别确定出学生手写正确的单词,如Hello、How、fabulous等等,再基于上文提到确定信息的置信度的技术确定并给出每一单词对应的置信度,如Hello置信度为0.99、How的置信度为0.89、fabulous的置信度为0.69;从而得到置信度为0.69的fabulous虽拼写真确,但由于其置信度低,可以判断学生对其的掌握程序不高;然后相应的给出词汇掌握程度较低的单词,并对其进行分类,可以是按照置信度的高低进行分类如不熟练单词、书写不规范单词、没有掌握蒙对单词。
本发明实施例所提供的信息确定方法,电子设备直接通过获取与模板信息匹配的手写文本信息中每一信息的置信度,以及组成每一信息的每一字符的痕迹参数,来确定出异常信息,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
基于前述实施例,本发明的实施例还提供一种电子设备5,该电子设备5可以应用于图1~3对应的实施例提供的一种信息确定方法中,参照图5所示,该电子设备5可以包括:处理器51、存储器51和通信总线51,其中:
通信总线53用于实现处理器51和存储器52之间的通信连接。
处理器51用于执行存储器52中存储的信息确定方法的程序,以实现以下步骤:
获取待处理信息中每一信息的置信度;其中,待处理信息为与模板信息匹配的手写文本信息;
获取待处理信息中组成每一信息的每一字符的痕迹参数;其中,痕迹参数表征每一字符在手写完成后呈现的状态;
基于痕迹参数和置信度,从待处理信息中确定异常信息。
本发明的其他实施例中,处理器51用于执行存储器52中存储的获取待处理信息中每一信息的置信度,还可以实现以下步骤:
对待处理信息中的每一信息进行识别,并将识别结果和模板信息进行匹配;
基于匹配结果,获取待处理信息中每一信息的置信度。
本发明的其他实施例中,处理器51用于执行存储器52中存储的基于匹配结果,获取待处理信息中每一信息的置信度,还可以实现以下步骤:
基于匹配结果,确定待处理信息中每一信息对应模板信息中每一信息的置信区间;
基于置信区间,获取待处理信息中每一信息的置信度。
本发明的其他实施例中,处理器51用于执行存储器52中存储的基于痕迹参数和置信度,从待处理信息中确定异常信息,还可以实现以下步骤:
基于置信度,从待处理信息中确定参考信息;
确定参考信息中组成每一信息的每一字符的痕迹参数;
基于参考信息中组成每一信息的每一字符的痕迹参数,从参考信息中确定异常信息。
本发明的其他实施例中,处理器51用于执行存储器52中存储的基于参考信息中组成每一信息的每一字符的痕迹参数,从参考信息中确定异常信息,还可以实现以下步骤:
基于痕迹参数,从参考信息中确定待筛选信息;
获取每一待筛选信息对应的目标文本信息的第一轨迹参数和每一待筛选信息的第二轨迹参数;其中,目标文本信息与待筛选信息具有关联关系;
基于第一轨迹参数和第二轨迹参数,从待筛选信息中确定异常信息。
本发明的其他实施例中,处理器51用于执行存储器52中存储的基于第一轨迹参数和第二轨迹参数,从待筛选信息中确定异常信息,还可以实现以下步骤:
对每一待筛选信息的第一轨迹参数和第二轨迹参数进行一致性匹配,获得匹配结果;
基于匹配结果,从待筛选信息中确定异常信息。
本发明的其他实施例中,处理器51用于执行存储器52中存储的基于参考信息中组成每一信息的每一字符的痕迹参数,从参考信息中确定异常信息,还可以实现以下步骤:
获取参考信息中,每一信息对应的区域内与每一信息相关联的修改参数;
从参考信息中,确定修改参数满足预设修改条件且痕迹参数符合撰写异常条件的信息为异常信息。
本发明的其他实施例中,处理器51用于执行存储器52中存储的获取待处理信息中每一信息的置信度之前,还可以实现以下步骤:
获取手写文本信息;
从手写文本信息中获取与模板信息匹配的信息,得到待处理信息。
需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的信息确定方法中的实现过程,此处不再赘述。
本发明实施例所提供的电子设备,直接通过获取与模板信息匹配的手写文本信息中每一信息的置信度,以及组成每一信息的每一字符的痕迹参数,来确定出异常信息,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
基于前述实施例,本发明的实施例还提供一种信息确定装置6,该信息确定装置6可以应用于图1~3对应的实施例提供的一种信息确定方法中,参照图6所示,该信息确定装置6可以包括:第一获取单元61、第二获取单元62和处理单元63,其中:
第一获取单元61,用于获取待处理信息中每一信息的置信度;其中,待处理信息为与模板信息匹配的手写文本信息;
第二获取单元62,用于获取待处理信息中组成每一信息的每一字符的痕迹参数;其中,痕迹参数表征每一字符在手写完成后呈现的状态;
处理单元63,用于基于痕迹参数和置信度,从待处理信息中确定异常信息。
在本发明其他实施例中,第一获取单元61,还用于对待处理信息中的每一信息进行识别,并将识别结果和模板信息进行匹配;基于匹配结果,获取待处理信息中每一信息的置信度。
在本发明其他实施例中,第一获取单元61,还用于基于匹配结果,确定待处理信息中每一信息对应模板信息中每一信息的置信区间;基于置信区间,获取待处理信息中每一信息的置信度。
在本发明其他实施例中,处理单元63,还用于基于置信度,从待处理信息中确定参考信息;确定参考信息中组成每一信息的每一字符的痕迹参数;基于参考信息中组成每一信息的每一字符的痕迹参数,从参考信息中确定异常信息。
在本发明其他实施例中,处理单元63,还用于基于痕迹参数,从参考信息中确定待筛选信息;获取每一待筛选信息对应的目标文本信息的第一轨迹参数和每一待筛选信息的第二轨迹参数;其中,目标文本信息与待筛选信息具有关联关系;基于第一轨迹参数和第二轨迹参数,从待筛选信息中确定异常信息。
在本发明其他实施例中,处理单元63,还用于对每一待筛选信息的第一轨迹参数和第二轨迹参数进行一致性匹配,获得匹配结果;基于匹配结果,从待筛选信息中确定异常信息。
在本发明其他实施例中,处理单元63,还用于获取参考信息中,每一信息对应的区域内与每一信息相关联的修改参数;从参考信息中,确定修改参数满足预设修改条件且痕迹参数符合撰写异常条件的信息为异常信息。
在本发明其他实施例中,处理单元63,还用于获取手写文本信息;从手写文本信息中获取与模板信息匹配的信息,得到待处理信息。
需要说明的是,本实施例中各个单元所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的信息确定方法中的实现过程,此处不再赘述。
本发明实施例所提供的信息确定装置,直接通过获取与模板信息匹配的手写文本信息中每一信息的置信度,以及组成每一信息的每一字符的痕迹参数,来确定出异常信息,有效地避免了相关技术中存在用户猜测撰写或模糊拼写的内容被识别为正确内容的问题,提高了从用户手写内容中确定出异常内容的精确度。
基于前述实施例,本发明的实施例提供一种计算机可读存储介质,计算机可读存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如图1~3对应的实施例提供的信息确定方法的步骤。
需要说明的是,上述处理器或CPU可以为特定用途集成电路(ApplicationSpecific Integrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(Field Programmable GateArray,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
需要说明的是,上述计算机存储介质/存储器可以是只读存储器(Read OnlyMemory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (7)
1.一种信息确定方法,所述方法包括:
获取待处理信息中每一信息的置信度;其中,所述待处理信息为与模板信息匹配的手写文本信息;
获取所述待处理信息中组成每一信息的每一字符的痕迹参数;其中,所述痕迹参数表征所述每一字符在手写完成后呈现的状态;
将所述待处理信息中所述置信度的值小于置信度阈值所对应的信息,确定为参考信息;
基于所述参考信息中组成每一信息的每一字符的痕迹参数,从所述参考信息中确定待筛选信息;
获取每一待筛选信息对应的目标文本信息的第一轨迹参数和所述每一待筛选信息的第二轨迹参数;其中,所述目标文本信息与所述待筛选信息具有关联关系;
在所述待筛选信息中,将所述第一轨迹参数和所述第二轨迹参数之间的匹配度小于匹配阈值所对应的信息,确定为异常信息。
2.根据权利要求1所述的方法,其特征在于,所述获取待处理信息中每一信息的置信度,包括:
对所述待处理信息中的每一信息进行识别,并将识别结果和所述模板信息进行匹配;
基于匹配结果,获取所述待处理信息中每一信息的置信度。
3.根据权利要求2所述的方法,其特征在于,所述基于匹配结果,获取所述待处理信息中每一信息的置信度,包括:
基于所述匹配结果,确定所述待处理信息中每一信息对应所述模板信息中每一信息的置信区间;
基于所述置信区间,获取所述待处理信息中每一信息的置信度。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述参考信息中,每一信息对应的区域内与所述每一信息相关联的修改参数;
从所述参考信息中,确定所述修改参数满足预设修改条件且所述痕迹参数符合撰写异常条件的信息为所述异常信息。
5.根据权利要求1所述的方法,其特征在于,所述获取待处理信息中每一信息的置信度之前,所述方法还包括:
获取所述手写文本信息;
从所述手写文本信息中获取与所述模板信息匹配的信息,得到所述待处理信息。
6.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器和通信总线;
所述通信总线用于实现处理器和存储器之间的通信连接;
所述处理器用于执行存储器中的信息确定方法的程序,以实现以下步骤:
获取待处理信息中每一信息的置信度;其中,所述待处理信息为与模板信息匹配的手写文本信息;
获取所述待处理信息中组成每一信息的每一字符的痕迹参数;其中,所述痕迹参数表征所述每一字符在手写完成后呈现的状态;
将所述待处理信息中所述置信度的值小于置信度阈值所对应的信息,确定为参考信息;
基于所述参考信息中组成每一信息的每一字符的痕迹参数,从所述参考信息中确定待筛选信息;
获取每一待筛选信息对应的目标文本信息的第一轨迹参数和所述每一待筛选信息的第二轨迹参数;其中,所述目标文本信息与所述待筛选信息具有关联关系;
在所述待筛选信息中,将所述第一轨迹参数和所述第二轨迹参数之间的匹配度小于匹配阈值所对应的信息,确定为异常信息。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的信息确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010718608.3A CN111931828B (zh) | 2020-07-23 | 2020-07-23 | 一种信息确定方法、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010718608.3A CN111931828B (zh) | 2020-07-23 | 2020-07-23 | 一种信息确定方法、电子设备和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931828A CN111931828A (zh) | 2020-11-13 |
CN111931828B true CN111931828B (zh) | 2024-03-01 |
Family
ID=73315743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010718608.3A Active CN111931828B (zh) | 2020-07-23 | 2020-07-23 | 一种信息确定方法、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931828B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1482571A (zh) * | 2003-04-11 | 2004-03-17 | 清华大学 | 基于单个字符的统计笔迹鉴别和验证方法 |
CN104268603A (zh) * | 2014-09-16 | 2015-01-07 | 科大讯飞股份有限公司 | 用于文字性客观题的智能阅卷方法及系统 |
CN107463866A (zh) * | 2016-06-06 | 2017-12-12 | 青岛大学 | 一种用于成绩评价的识别手写实验报告的方法 |
CN109740515A (zh) * | 2018-12-29 | 2019-05-10 | 科大讯飞股份有限公司 | 一种评阅方法及装置 |
CN111081093A (zh) * | 2019-07-11 | 2020-04-28 | 广东小天才科技有限公司 | 一种听写内容辨别方法及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7500265B2 (en) * | 2004-08-27 | 2009-03-03 | International Business Machines Corporation | Apparatus and method to identify SPAM emails |
-
2020
- 2020-07-23 CN CN202010718608.3A patent/CN111931828B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1482571A (zh) * | 2003-04-11 | 2004-03-17 | 清华大学 | 基于单个字符的统计笔迹鉴别和验证方法 |
CN104268603A (zh) * | 2014-09-16 | 2015-01-07 | 科大讯飞股份有限公司 | 用于文字性客观题的智能阅卷方法及系统 |
CN107463866A (zh) * | 2016-06-06 | 2017-12-12 | 青岛大学 | 一种用于成绩评价的识别手写实验报告的方法 |
CN109740515A (zh) * | 2018-12-29 | 2019-05-10 | 科大讯飞股份有限公司 | 一种评阅方法及装置 |
CN111081093A (zh) * | 2019-07-11 | 2020-04-28 | 广东小天才科技有限公司 | 一种听写内容辨别方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111931828A (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10853638B2 (en) | System and method for extracting structured information from image documents | |
CN106156766B (zh) | 文本行分类器的生成方法及装置 | |
CN110929573A (zh) | 基于图像检测的试题检查方法及相关设备 | |
CN110598686B (zh) | 发票的识别方法、系统、电子设备和介质 | |
CN111507330B (zh) | 习题识别方法、装置、电子设备及存储介质 | |
CN111274239B (zh) | 试卷结构化处理方法、装置和设备 | |
CN111340020B (zh) | 一种公式识别方法、装置、设备及存储介质 | |
US10963717B1 (en) | Auto-correction of pattern defined strings | |
CN110928971B (zh) | 一种提高地址识别精确度的方法及装置 | |
CN114549993B (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
CN113312899B (zh) | 文本分类方法、装置和电子设备 | |
CN111626177A (zh) | 一种pcb元件识别方法及装置 | |
EP2653981A1 (en) | Natural language processing device, method, and program | |
CN110544246A (zh) | 一种自动化测试方法、装置及存储介质 | |
WO2023038722A1 (en) | Entry detection and recognition for custom forms | |
CN112149680A (zh) | 错字检测识别方法、装置、电子设备及存储介质 | |
CN111931828B (zh) | 一种信息确定方法、电子设备和计算机可读存储介质 | |
US9418281B2 (en) | Segmentation of overwritten online handwriting input | |
CN114078109A (zh) | 图像处理方法、电子装置和存储介质 | |
CN111144345A (zh) | 字符识别方法、装置、设备及存储介质 | |
US11756321B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN111079736A (zh) | 一种听写内容识别方法及电子设备 | |
CN112132239A (zh) | 一种训练方法、装置、设备和存储介质 | |
CN112434700A (zh) | 车牌识别方法、装置、设备及存储介质 | |
CN113515588A (zh) | 表单数据检测方法、计算机装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |