CN111079504A - 一种文字识别方法及电子设备 - Google Patents
一种文字识别方法及电子设备 Download PDFInfo
- Publication number
- CN111079504A CN111079504A CN201910746744.0A CN201910746744A CN111079504A CN 111079504 A CN111079504 A CN 111079504A CN 201910746744 A CN201910746744 A CN 201910746744A CN 111079504 A CN111079504 A CN 111079504A
- Authority
- CN
- China
- Prior art keywords
- dictation
- matching identification
- user
- identification result
- electronic device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000001514 detection method Methods 0.000 claims abstract description 41
- 239000000284 extract Substances 0.000 claims description 14
- 238000013515 script Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 3
- 230000008451 emotion Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 230000001815 facial effect Effects 0.000 description 4
- 210000003128 head Anatomy 0.000 description 4
- 238000007639 printing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 208000003443 Unconsciousness Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 206010012374 Depressed mood Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明实施例涉及教育技术领域,公开了一种文字识别方法及电子设备,该方法包括:在电子设备处于听写状态时,控制摄像设备进行拍摄,以获得拍摄图像;从拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹;将文字笔迹进行位置匹配识别、播报顺序匹配识别以及笔顺匹配识别,以得到第一匹配识别结果、第二匹配识别结果以及第三匹配识别结果;根据第一匹配识别结果、第二匹配识别结果以及第三匹配识别结果,计算得到多维度匹配识别的准确率;当检测到多维度匹配识别的准确率达到指定阈值时,确定文字笔迹书写正确,以及输出听写结果。本发明实施例,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
Description
技术领域
本发明涉及教育技术领域,尤其涉及一种文字识别方法及电子设备。
背景技术
目前,市面上的多数电子设备(如家教机)大都具有听写功能,这类电子设备在识别用户的听写内容时,大多是通过单纯的图像识别技术从书写页面中识别出用户的书写内容。
但在实践中发现,由于图像识别技术的识别率较低,因此需要用户进行非常工整的文字书写,且部分用户可能刚学会写字,他们的文字书写并不规范,容易影响听写检测的准确率。
发明内容
本发明实施例公开一种文字识别方法及电子设备,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
本发明实施例第一方面公开一种文字识别方法,所述方法包括:
在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像;
从所述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹;
将所述文字笔迹进行位置匹配识别,得到第一匹配识别结果;将所述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果;将所述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果;
根据所述第一匹配识别结果、所述第二匹配识别结果以及所述第三匹配识别结果,计算得到多维度匹配识别的准确率;
检测所述多维度匹配识别的准确率是否达到指定阈值,若是,确定所述文字笔迹书写正确,以及输出听写结果。
本发明实施例第二方面公开一种电子设备,所述电子设备包括:
第一控制单元,用于在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像;
提取单元,用于从所述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹;
第一识别单元,用于将所述文字笔迹进行位置匹配识别,得到第一匹配识别结果;将所述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果;将所述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果;
计算单元,用于根据所述第一匹配识别结果、所述第二匹配识别结果以及所述第三匹配识别结果,计算得到所述多维度匹配识别的准确率;
第一检测单元,用于检测所述多维度匹配识别的准确率是否达到指定阈值;
确定单元,用于在所述第一检测单元检测出所述多维度匹配识别的准确率达到指定阈值时,确定所述文字笔迹书写正确,以及输出听写结果。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种文字识别方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种文字识别方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,在检测到电子设备处于听写状态时,电子设备可以控制摄像设备执行拍摄操作,以获得第一拍摄图像,并可以从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹,并可以将该文字笔迹进行位置匹配识别,得到第一匹配识别结果,以及将该文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果,以及将该文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果,电子设备可以根据上述第一匹配识别结果、上述第二匹配识别结果以及上述第三匹配识别结果,计算得到多维度匹配识别的准确率,电子设备可以检测该多维度匹配识别的准确率是否达到指定阈值,若是,电子设备可以确定上述文字笔迹书写正确,以及输出听写结果。可见,本发明实施例,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种文字识别方法的流程示意图;
图2是本发明实施例公开的另一种文字识别方法的流程示意图;
图3是本发明实施例公开的另一种文字识别方法的流程示意图;
图4是本发明实施例公开的一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图;
图6是本发明实施例公开的另一种电子设备的结构示意图;
图7是本发明实施例公开的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种文字识别方法及电子设备,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。以下结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种文字识别方法的流程示意图。如图1所示,该文字识别方法可以包括以下步骤。
101、电子设备在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像。
本发明实施例中,电子设备可以是供学生使用的学习平板、学习机、家教机、点读机等电子设备,本发明实施例中不做限定。
作为一种可选的实施方式,本发明实施例中,在检测到电子设备处于听写状态时,电子设备还可以控制摄像设备拍摄用户的人脸图像,并可以根据该用户的人脸图像,获取得到用户的人脸特征;
以及,在电子设备获取得到用户的人脸特征之后,电子设备还可以获取与用户的人脸特征相匹配的听写字词;
以及,在电子设备获取与用户的人脸特征相匹配的听写字词之后,电子设备可以将该听写字词所对应的听写音频节进行播放。
作为一种可选的实施方式,本发明实施例中,在电子设备获得第一拍摄图像之后,电子设备可以检测第一拍摄图像中是否存在书写页面,若否,电子设备可以控制设置于电子设备上方的反光镜弹出,并可以通过调节反光镜相对于摄像设备的镜头面的角度,使用户无论以什么角度使用电子设备,反光镜中的镜像皆存在有书写页面;
以及,在电子战设备调节反光镜相对于摄像设备的镜头面的角度之后,电子设备可以控制摄像设备对反光镜中的镜像中进行拍摄,以获得含有书写页面的第一拍摄图像。
102、电子设备从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹。
作为一种可选的实施方式,本发明实施例中,电子设备可以在电子设备播报完所有的听写音频节后再从上述第一拍摄图像中一一提取用户根据播报的听写音频节所书写的文字笔迹;
和/或,电子设备可以在电子设备播报完当前的听写音频节之后即刻从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹。
作为一种可选的实施方式,本发明实施例中,上述听写音频节可以是整个听写音频文件中的任一听写内容的听写音频节,例如,若电子设备的整个听写音频文件中含有“你好”、“假如”、“家人”、“存在”以及“学习”等听写内容所对应的听写音频节,当电子设备需要播报“存在”这一听写内容时,电子设备可以只播报含有“存在”一词的听写音频节。
103、电子设备将上述文字笔迹进行位置匹配识别,得到第一匹配识别结果;将上述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果;将上述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果。
本发明实施例中,电子设备将上述文字笔迹进行位置匹配识别,得到第一匹配识别结果,可以包括:
检测上述文字笔迹的位置排列是否与预设位置排列相匹配;若是,输出匹配识别结果为正确的第一匹配识别结果;
以及,电子设备将上述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果,可以包括:
检测上述文字笔迹是否与听写音频节播报的听写内容相匹配;若是,输出匹配识别结果为正确的第二匹配识别结果;
以及,电子设备将上述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果,可以包括:
检测上述文字笔迹的笔顺是否与听写音频节播报的听写内容的标准书写笔顺相匹配;若是,输出匹配识别结果为正确的第三匹配识别结果。
作为一种可选的实施方式,本发明实施例中,在电子设备从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹之后,电子设备还可以提取上述文字笔迹的特征,并可以根据该特征从印刷通用字体库中获取与该特征相符的文字;
以及,在电子设备从印刷通用字体库中获取与该特征相符的文字之后,电子设备可以将上述文字笔迹与上述文字进行识别匹配。
104、电子设备根据上述第一匹配识别结果、上述第二匹配识别结果以及上述第三匹配识别结果,计算得到多维度匹配识别的准确率。
作为一种可选的实施方式,本发明实施例中,电子设备可以平均分配匹配识别结果在多维度匹配识别的准确率中的决定权;和/或,电子设备可以根据匹配识别的内容的重要性来分配匹配识别结果在多维度匹配识别的准确率中的决定权。
举例来说,电子设备可以设定上述任一匹配识别所得的结果在多维度匹配识别的准确率中皆占有33.33%的决定权,即当任一匹配识别所得的结果为正确时,电子设备即可获得该33.33%的正确决定权,若任一匹配识别所得的结果为错误时,电子设备无法获取任何的决定权。
又举例来说,电子设备可以设定播报顺序匹配识别的重要性最大,即第二匹配识别结果在多维度匹配识别的准确率中的决定权最大,可以设定位置匹配识别的重要性与笔顺的匹配识别的重要性相当,即第二匹配识别结果与第三匹配识别结果在多维度匹配识别的准确率中的决定权为其次。可以理解为,电子设备可以设定第二匹配识别结果占有50%的决定权,而第二匹配识别结果与第三匹配识别结果各占有25%的决定权,即当第二匹配识别结果为正确时,电子设备即可获得该50%的正确决定权,若第二匹配识别结果为错误时,电子设备无法获取任何的决定权,而第二匹配识别结果与第三匹配识别结果同理如上。
105、电子设备检测上述多维度匹配识别的准确率是否达到指定阈值,若是,执行步骤106,若否,结束本次流程。
作为一种可选的实施方式,本发明实施例中,在电子设备检测出上述多维度匹配识别的准确率达到指定阈值时,电子设备还可以检测上述多维度匹配识别的准确率是否达到100%,即上述匹配识别结果是否皆为正确,若是,电子设备可以执行步骤106,若否,电子设备可以将匹配识别结果为错误的匹配识别内容输出至电子设备的显示屏,以让用户获悉自己对上述文字笔迹的不掌握情况。
106、电子设备确定上述文字笔迹书写正确,以及输出听写结果。
作为一种可选的实施方式,本发明实施例中,在电子设备确定上述文字笔迹书写正确,以及输出听写结果之后,电子设备还可以获取输出的书写结果为错误的错误文字笔迹,并可以获取该错误文字笔迹在上述匹配识别中结果为错误的识别匹配内容,以获得该错误文字笔迹的书写情况;
以及,在电子设备获得该错误文字笔迹的书写情况之后,电子设备可以发出提示信息,以提示用户在哪一方面书写错误,请及时改正;
以及,在电子设备发送提示信息之后,电子设备可以检测用户是否将上述错误文字笔迹进行修改,若是,电子设备可以对该修改过的文字笔迹进行多维度的匹配识别,若否,电子设备可以将上述错误文字笔迹的正确书写过程输出至电子设备的显示屏上;
以及,在电子设备将上述错误文字笔迹的正确书写过程输出至电子设备的显示屏上之后,电子设备还可以将该错误文字笔迹和用户的身份信息上报给该用户对应的教师终端,让教师终端所属教师获悉哪一些字对于用户而言是陌生的或者是尚未掌握的,以便于教师可以对该用户进行针对性的加以辅导。
可见,实施图1所描述的文字识别方法,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
此外,实施图1所描述的文字识别方法,能够让用户所属的教师获悉哪一些字对于用户而言是陌生的或者是尚未掌握的,以便于教师可以对该用户进行针对性的加以辅导。
此外,实施图1所描述的文字识别方法,能够使用户无论以什么角度使用电子设备,电子设备皆可以获取用户的书写页面。
实施例二
请参阅图2,图2是本发明实施例公开的另一种文字识别方法的流程示意图。如图2所示,该文字识别方法可以包括以下步骤。
201、电子设备在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像。
202、电子设备检测用户在指定时长内是否将听写音频节所对应的听写字词书写完毕,若否,执行步骤203~步骤204,若是,执行步骤206~步骤207。
作为一种可选的实施方式,本发明实施例中,在电子设备播报上述听写音频节时,用户能够获取到的只有上述听写音频节所对应的听写字词的发音,当用户无法根据上述听写音频节所对应的听写内容的发音完成听写字词的书写时,用户可以向电子设备发出询问信息以寻求提示。
作为一种可选的实施方式,本发明实施例中,在电子设备播报上述听写音频节之后,电子设备的显示屏可以开始进入倒计时模式,并可检测用户是否在倒计时内书写完毕上述听写字词,若用户在倒计时内未书写完毕上述听写字词,电子设备可以执行步骤203~步骤204。
作为一种可选的实施方式,本发明实施例中,上述的指定时长可以默认是由电子设备的系统统一设定;和/或,可以是由用户对应的教师终端或家长终端用户设定;和/或,可以是由用户自行设定。
203、电子设备采集用户的第一语音信息。
作为一种可选的实施方式,本发明实施例中,用户可以通过语音方式来向电子设备输入需要再次播报上述听写音频节的请求;和/或用户可以通过触屏方式手动来向电子设备输入需要再次播报上述听写音频节的请求;和/或用户可以通过手动开启设置在电子设备上的物理按键开关来向电子设备输入需要再次播报上述听写音频节的请求。
204、电子设备从语音信息中识别出用户是否需要再次播报上述听写音频节,若是,执行步骤205~步骤207,若否,结束本次流程。
作为一种可选的实施方式,本发明实施例中,电子设备可以对采集到的语音信息进行识别,以识别该语音信息是否存在用于触发电子设备进行再次播报上述听写音频节操作的预设关键字词,例如“听不清楚”、“什么意思”或“再播报一次”等,若存在,电子设备可以判断出用户当前需要再次播报上述听写音频节。
205、电子设备播报上述听写音频节。
作为一种可选的实施方式,本发明实施例中,在电子设备播报上述听写音频节之后,电子设备可以检测用户在预设时间内是否将该听写音频节所对应的听写字词书写完毕,若否,电子设备可以输出询问信息,以询问用户是否需要获取该听写字词的提示信息;
以及,若用户需要获取该听写字词的提示信息,电子设备可以播放与上述听写字词相关的提示信息;其中,在电子设备中对于上述听写字词可以具有多个提示信息,电子设备播放提示信息的优先级从高到底可以为与该听写字词有关的提示度。例如,电子设备可以先播放含有少量提示内容的提示信息,再进行检测用户在指定时长内是否书写完毕该听写字词,若否,再播放含有更多提示内容的提示信息;
以及,在电子设备把含有该听写字词的提示信息全部播放完毕之后,电子设备可以进入等待阶段,用户可以在该等待阶段内书写完毕上述听写字词,在该等待阶段结束后,电子设备可以进行播放听写字词所对应的听写音频节。
206、电子设备从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹。
207、电子设备检测文字笔迹的位置排列是否与预设位置排列相匹配,若是,执行步骤208~步骤209,若否,结束本次流程。
作为一种可选的实施方式,本发明实施例中,上述文字笔迹的固定位置排列可以是由电子设备的系统统一设定;和/或,可以是由用户对应的教师终端或家长终端用户设定;和/或,可以是由用户自行设定。
举例来说,当电子设备设定上述文字笔迹的固定位置排列为横向排列时,电子设备可以检测上述文字笔迹的位置排列是否为横向排列,若否,电子设备可以输出匹配识别结果为错误的第一匹配识别结果。
作为一种可选的实施方式,本发明实施例中,由于文字笔迹的位置排列可以为竖向排列,也可以为横向排列,在书写过程中可能会出现竖向排列与横向排列的交替书写现象,而实施上述实施例可以有效的避免出现文字笔迹书写潦草凌乱的现象,以提高听写检测的准确率。
208、电子设备输出匹配识别结果为正确的第一匹配识别结果。
作为一种可选的实施方式,本发明实施例中,若电子设备检测出文字笔迹的位置排列不与预设位置排列相匹配时,电子设备可以输出匹配识别结果为错误的第一匹配识别结果;
以及,在电子设备输出匹配识别结果为错误的第一匹配识别结果之后,电子设备还可以输出提示信息,以提示用户更改文字笔迹的书写位置排列,并注意书写规范。
209、电子设备检测文字笔迹是否与听写音频节播报的听写内容相匹配,若是,执行步骤210~步骤211,若否,结束本次流程。
作为一种可选的实施方式,本发明实施例中,电子设备还可以检测文字笔迹是否与该听写音频节依顺序播报的听写内容相匹配,若是,电子设备可以执行步骤210~步骤211。
举例来说,若当前的听写音频节依顺序播报的听写内容为“家人”,但用户的文字笔迹为“人家”,电子设备可以判断出该文字笔迹不与该听写音频节依顺序播报的听写内容相匹配,电子设备可以输出匹配识别结果为错误的第二匹配识别结果。
210、电子设备输出匹配识别结果为正确的第二匹配识别结果。
作为一种可选的实施方式,本发明实施例中,若电子设备检测出文字笔迹不与听写音频节播报的听写内容相匹配时,电子设备可以输出匹配识别结果为错误的第二匹配识别结果;
以及,在电子设备输出匹配识别结果为错误的第二匹配识别结果之后,电子设备还可以输出提示信息,以提示用户的文字笔迹书写错误,请及时做出更改。
211、电子设备检测文字笔迹的笔顺是否与听写音频节播报的听写内容的标准书写笔顺相匹配,若是,执行步骤212~步骤214,若否,结束本次流程。
作为一种可选的实施方式,本发明实施例中,电子设备所获取得到的文字笔迹的实际书写笔顺至少包括文字笔迹的实际相对位置、文字笔迹的书写向量方向以及文字笔迹的第一和第二汉字笔画的交叉点;
以及,在电子设备获取得到文字笔迹的实际书写笔顺之后,电子设备可以检测文字笔迹的相对位置、文字笔迹的书写向量方向以及文字笔迹的第一和第二汉字笔画的交叉点是否与目标汉字中笔画书写相符;其中,电子设备可以依次顺序检测,也可以同步检测;
以及,在电子设备进行检测时只要上述任一项不与目标汉字中笔画书写相符,即可确定用户书写有误,而实施本发明实施例,能够有效提高用户输入笔画的检测效率。
212、电子设备输出匹配识别结果为正确的第三匹配识别结果。
作为一种可选的实施方式,本发明实施例中,若电子设备检测出文字笔迹的笔顺不与听写音频节播报的听写内容的标准书写笔顺相匹配时,电子设备可以输出匹配识别结果为错误的第三匹配识别结果;
以及,在电子设备输出匹配识别结果为错误的第三匹配识别结果之后,电子设备可以将该文字笔迹的标准书写笔顺的书写视频输出至电子设备的显示屏上,以让用户按照该书写视频将该文字笔迹重新书写一遍。
213、电子设备根据上述第一匹配识别结果、上述第二匹配识别结果以及上述第三匹配识别结果,计算得到多维度匹配识别的准确率。
214、电子设备检测上述多维度匹配识别的准确率是否达到指定阈值,若是,执行步骤215,若否,结束本次流程。
215、电子设备确定上述文字笔迹书写正确,以及输出听写结果。
作为一种可选的实施方式,本发明实施例中,在电子设备输出听写结果之后,电子设备可以控制摄像设备对用户进行拍摄,以获得含有用户面部图像的拍摄图像;
以及,在电子设备获得含有用户面部图像的拍摄图像之后,电子设备可以从上述拍摄图像中获取得到用户的面部特征,并可以根据该面部特征从电子设备预存的人像信息中获取得到用户的身份信息;
以及,在电子设备从电子设备预存的人像信息中获取得到用户的身份信息之后,电子设备可以根据用户的身份信息以得到用户的好友列表,并从好友列表中获取与用户处于同一听写时间的好友;
以及,在电子设备从好友列表中获取与用户处于同一听写时间的好友之后,电子设备可将该好友推送至电子设备的显示屏上,以使用户可以获悉当前与用户处于同一听写时间的好友,以增加用户与好友之间在学习上的交流,以便提高用户学习的积极性。
可见,实施图2所描述的文字识别方法,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
此外,实施图2所描述的文字识别方法,能够让用户获悉当前与用户处于同一听写时间的好友,以增加用户与好友之间在学习上的交流,以便提高用户学习的积极性。
此外,实施图2所描述的文字识别方法,能够有效的避免出现文字笔迹书写潦草凌乱的现象,以提高听写检测的准确率。
此外,实施图2所描述的文字识别方法,能够有效的提高用户输入笔画的检测效率。
实施例三
请参阅图3,图3是本发明实施例公开的另一种文字识别方法的流程示意图。如图3所示,该文字识别方法可以包括以下步骤。
301、电子设备在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像。
302、电子设备检测用户在指定时长内是否将听写音频节所对应的听写字词书写完毕,若否,执行步骤303~步骤304,若是,执行步骤313~步骤314。
303、电子设备控制摄像设备对用户进行拍摄,以获得含有用户面部图像的第二拍摄图像。
作为一种可选的实施方式,本发明实施例中,电子设备可以装有眼睛聚焦检测装置,该眼睛聚焦检测装置在硬件上可以至少包括摄像头,在软件上可以包括电子设备预先存储的人眼视线估计模型,该人眼视线估计模型能够用于检测用户眼睛的聚焦点位置。
作为一种可选的实施方式,本发明实施例中,在电子设备获取到含有用户面部图像的第二拍摄图像之后,电子设备可以对含有用户面部图像的第二拍摄图像进行分析,进而得到用户的当前情绪类型;
在电子设备得到用户的当前情绪类型之后,电子设备可以判断当前情绪类型是否为低落情绪,若是,电子设备可以停止当前对上述的听写内容进行听写的操作,并可以检测用户当前所处的位置环境是否适合进行改善低落情绪的运动(如散步),若适合,向用户发送提示信息,以便于用户改善低落情绪。
304、电子设备根据上述第二拍摄图像,检测用户眼睛的聚焦点位置是否在书写页面上,若否,执行步骤305~步骤307,若是,执行步骤306~步骤307。
作为一种可选的实施方式,本发明实施例中,若电子设备检测出用户眼睛的聚焦点位置在书写页面上,但当前用户需要电子设备对上述听写音频节进行再次播报时,电子设备可以控制摄像设备实时采集用户的手部动作,当电子设备检测到用户的手部动作为预设动作时,电子设备可以对上述听写音频节进行再次播报。
作为一种可选的实施方式,本发明实施例中,在实际听写应用场景中,当用户在进行听写字词的书写时,用户的头部会处于低垂的状态,以及用户眼睛的聚焦点位置是在书写页面上的,而当用户将该听写字词书写完毕之后,用户会下意识地抬头看向报读者(在本发明实施例中报读者为电子设备),以便听清下一个听写音频节所播报的内容,进而在本发明实施例中,当电子设备检测到用户眼睛的聚焦点位置不在书写页面上时,电子设备可以检测用户眼睛的聚焦点位置是否在电子设备的显示屏上,若是,即可触发电子设备播报下一听写音频节。
305、电子设备控制电子设备输出提示信息,并重复播报上述听写音频节。
作为一种可选的实施方式,本发明实施例中,若电子设备检测出用户眼睛的聚焦点位置不在书写页面上时,电子设备可以判断出用户当前处于精神不集中状态,电子设备可以向电子设备发送提示信息,以提示用户集中精神进行听写。
306、电子设备采集用户的第一语音信息。
307、电子设备从语音信息中识别出用户是否需要再次播报听写音频节,若是,执行步骤307~步骤309,若否,结束本次流程。
308、电子设备播报上述听写音频节。
309、电子设备判断上述听写字词是否属于预设的易混淆字词,若是,执行步骤310~步骤311,若否,结束本次流程。
作为一种可选的实施方式,本发明实施例中,电子设备还可以检测当前所有播报的听写音频节中所对应的听写字词里是否含有与上述听写字词发音相同的同音异义词,例如“报道”与“报到”,若是,电子设备可以判断出上述听写字词为预设的易混淆字词。
310、电子设备采集用户的第二语音信息。
311、电子设备检测上述第二语音信息是否含有用于触发所述电子设备进行听写提示操作的预设关键字词,若是,执行步骤312~步骤314,若否,结束本次流程。
312、电子设备控制电子设备播放上述听写字词的提示信息。
作为一种可选的实施方式,本发明实施例中,电子设备还可以获取上述听写字词的关联知识点,其中,该关联知识点可以包括:上述听写字词的拼音、偏旁部首、笔画和意思解释;和/或,上述听写字词的近义词、反义词、同义词、例句和用法;和/或,上述听写字词所对应的英文翻译、例句和用法;和/或,上述听写字词所对应的练习题;
以及,在电子设备获取上述听写字词的关联知识点之后,电子设备还可以将上述听写字词的关联知识点输出至电子设备的显示上,以加深用户对上述听写字词的掌握程度。
313、电子设备从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹。
314、电子设备检测文字笔迹的位置排列是否与预设位置排列相匹配,若是,执行步骤315~步骤316,若否,结束本次流程。
315、电子设备输出匹配识别结果为正确的第一匹配识别结果。
316、电子设备检测文字笔迹是否与听写音频节播报的听写内容相匹配,若是,执行步骤317~步骤318,若否,结束本次流程。
317、电子设备输出匹配识别结果为正确的第二匹配识别结果。
318、电子设备检测所述文字笔迹的笔顺是否与听写音频节播报的听写内容的标准书写笔顺相匹配,若是,执行步骤319~步骤321,若否,结束本次流程。
319、电子设备输出匹配识别结果为正确的第三匹配识别结果。
320、电子设备根据上述第一匹配识别结果、上述第二匹配识别结果以及上述第三匹配识别结果,计算得到多维度匹配识别的准确率。
321、电子设备检测上述多维度匹配识别的准确率是否达到指定阈值,若是,执行步骤322,若否,结束本次流程。
322、电子设备确定上述文字笔迹书写正确,以及输出听写结果。
作为一种可选的实施方式,本发明实施例中,在电子设备将听写结果输出至电子设备的显示屏上之后,电子设备还可以从服务器中获取与用户的听写内容相同的其他用户;
以及,在电子设备从服务器中获取与用户的听写内容相同的其他用户之后,电子设备还可以从服务器中获取其他用户对于上述听写内容的听写成绩;
以及,电子设备还可以判断用户对于上述听写内容的听写成绩是否高于其他用户对于上述听写内容的听写成绩,若否,电子设备可以获取其他用户利用电子设备的学习方式,并可以以此为参照调整用户的学习方式,有利于提高用户的学习效率。
可见,实施图3所描述的文字识别方法,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
此外,实施图3所描述的文字识别方法,能够及时获取改善用户低落情绪的方式,避免影响用户在听写过程中的注意力。
此外,实施图3所描述的文字识别方法,能够加深用户对听写字词的掌握程度。
此外,实施图3所描述的文字识别方法,能够在用处于精神不集中的状态时给予用户及时的提醒,避免由于用户精神不集中而导致听写检测的失误现象。
此外,实施图3所描述的文字识别方法,能够提高用户的学习效率。
实施例四
请参阅图4,图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示,该电子设备可以包括:
第一控制单元401,用于在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像。
提取单元402,用于从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹。
第一识别单元403,用于将上述文字笔迹进行位置匹配识别,得到第一匹配识别结果;将上述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果;将上述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果。
计算单元404,用于根据上述第一匹配识别结果、上述第二匹配识别结果以及上述第三匹配识别结果,计算得到多维度匹配识别的准确率。
第一检测单元405,用于检测上述多维度匹配识别的准确率是否达到指定阈值。
确定单元406,用于在上述第一检测单元检测出上述多维度匹配识别的准确率达到指定阈值时,确定上述文字笔迹书写正确,以及输出听写结果。
本发明实施例中,电子设备可以是供学生使用的学习平板、学习机、家教机、点读机等电子设备,本发明实施例中不做限定。
作为一种可选的实施方式,本发明实施例中,第一控制单元401还可以控制摄像设备拍摄用户的人脸图像,并可以根据该用户的人脸图像,获取得到用户的人脸特征;
以及,在电子设备获取得到用户的人脸特征之后,电子设备还可以获取与用户的人脸特征相匹配待听写字词。
作为一种可选的实施方式,本发明实施例中,在电子设备获得第一拍摄图像之后,电子设备可以检测第一拍摄图像中是否存在书写页面,若否,电子设备可以控制设置于电子设备上方的反光镜弹出,并可以通过调节反光镜相对于摄像设备的镜头面的角度,使用户无论以什么角度使用电子设备,反光镜中的镜像皆存在有书写页面。
作为一种可选的实施方式,本发明实施例中,提取单元402可以在电子设备播报完所有的听写音频节后再从上述第一拍摄图像中一一提取用户根据播报的听写音频节所书写的文字笔迹;
和/或,提取单元402可以在电子设备播报完当前的音频文件之后即刻从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹。
作为一种可选的实施方式,本发明实施例中,上述听写音频节可以是整个听写音频文件中的任一听写内容的听写音频节,例如,若电子设备的整个听写音频文件中含有“你好”、“假如”、“家人”、“存在”以及“学习”等听写内容所对应的听写音频节,当电子设备需要播报“存在”这一听写内容时,电子设备可以只播报含有“存在”一词的听写音频节。
本发明实施例中,第一识别单元403将上述文字笔迹进行位置匹配识别,得到第一匹配识别结果,可以包括:
检测上述文字笔迹的位置排列是否与预设位置排列相匹配;若是,输出匹配识别结果为正确的第一匹配识别结果;
以及,第一识别单元403将上述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果,可以包括:
检测上述文字笔迹是否与听写音频节播报的听写内容相匹配;若是,输出匹配识别结果为正确的第二匹配识别结果;
以及,第一识别单元403将上述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果,可以包括:
检测上述文字笔迹的笔顺是否与听写音频节播报的听写内容的标准书写笔顺相匹配;若是,输出匹配识别结果为正确的第三匹配识别结果。
作为一种可选的实施方式,本发明实施例中,在提取单元402从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹之后,提取单元402还可以提取上述文字笔迹的特征,并可以根据该特征从印刷通用字体库中获取与该特征相符的文字;
以及,在电子设备从印刷通用字体库中获取与该特征相符的文字之后,第一识别单元403可以将上述文字笔迹与上述文字进行识别匹配。
作为一种可选的实施方式,本发明实施例中,电子设备可以平均分配匹配识别结果在多维度匹配识别的准确率中的决定权;和/或,电子设备可以根据匹配识别的内容的重要性来分配匹配识别结果在多维度匹配识别的准确率中的决定权。
举例来说,电子设备可以设定上述任一匹配识别所得的结果在多维度匹配识别的准确率中皆占有33.33%的决定权,即当任一匹配识别所得的结果为正确时,电子设备即可获得该33.33%的正确决定权,若任一匹配识别所得的结果为错误时,电子设备无法获取任何的决定权。
又举例来说,电子设备可以设定播报顺序匹配识别的重要性最大,即第二匹配识别结果在多维度匹配识别的准确率中的决定权最大,可以设定位置匹配识别的重要性与笔顺的匹配识别的重要性相当,即第二匹配识别结果与第三匹配识别结果在多维度匹配识别的准确率中的决定权为其次。可以理解为,电子设备可以设定第二匹配识别结果占有50%的决定权,而第二匹配识别结果与第三匹配识别结果各占有25%的决定权,即当第二匹配识别结果为正确时,电子设备即可获得该50%的正确决定权,若第二匹配识别结果为错误时,电子设备无法获取任何的决定权,而第二匹配识别结果与第三匹配识别结果同理如上。
作为一种可选的实施方式,本发明实施例中,在第一检测单元405检测出上述多维度匹配识别的准确率达到指定阈值时,第一检测单元405还可以检测上述多维度匹配识别的准确率是否达到100%,即上述匹配识别结果是否皆为正确,若是,电子设备可以执行步骤106,若否,电子设备可以将匹配识别结果为错误的匹配识别内容输出至电子设备的显示屏,以让用户获悉自己对上述文字笔迹的不掌握情况。
作为一种可选的实施方式,本发明实施例中,在确定单元406确定上述文字笔迹书写正确,以及输出听写结果之后,电子设备还可以获取输出的书写结果为错误的错误文字笔迹,并可以获取该错误文字笔迹在上述匹配识别中结果为错误的识别匹配内容,以获得该错误文字笔迹的书写情况;
以及,在电子设备获得该错误文字笔迹的书写情况之后,电子设备可以发出提示信息,以提示用户在哪一方面书写错误,请及时改正;
以及,在电子设备发送提示信息之后,电子设备可以检测用户是否将上述错误文字笔迹进行修改,若是,电子设备可以对该修改过的文字笔迹进行多维度的匹配识别,若否,电子设备可以将上述错误文字笔迹的正确书写过程输出至电子设备的显示屏上;
以及,在电子设备将上述错误文字笔迹的正确书写过程输出至电子设备的显示屏上之后,电子设备还可以将该错误文字笔迹和用户的身份信息上报给该用户对应的教师终端,让教师终端所属教师获悉哪一些字对于用户而言是陌生的或者是尚未掌握的,以便于教师可以对该用户进行针对性的加以辅导。
可见,实施图4所描述的电子设备,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
此外,实施图4所描述的电子设备,能够让用户所属的教师获悉哪一些字对于用户而言是陌生的或者是尚未掌握的,以便于教师可以对该用户进行针对性的加以辅导。
此外,实施图4所描述的电子设备,能够使用户无论以什么角度使用电子设备,电子设备皆可以获取用户的书写页面。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。其中,图5所示的电子设备是由图4所示的电子设备进行优化得到的。与图4所示的电子设备相比较,图5所示的第一识别单元403包括:
检测子单元4031,用于检测上述文字笔迹的位置排列是否与预设位置排列相匹配。
作为一种可选的实施方式,本发明实施例中,上述文字笔迹的固定位置排列可以是由电子设备的系统统一设定;和/或,可以是由用户对应的教师终端或家长终端用户设定;和/或,可以是由用户自行设定。
举例来说,当电子设备设定上述文字笔迹的固定位置排列为横向排列时,检测子单元4031可以检测上述文字笔迹的位置排列是否为横向排列,若否,输出子单元4032可以输出匹配识别结果为错误的第一匹配识别结果。
作为一种可选的实施方式,本发明实施例中,由于文字笔迹的位置排列可以为竖向排列,也可以为横向排列,在书写过程中可能会出现竖向排列与横向排列的交替书写现象,而实施上述实施例可以有效的避免出现文字笔迹书写潦草凌乱的现象,以提高听写检测的准确率。
输出子单元4032,用于在第一检测子单元4031检测出上述文字笔迹的位置排列与预设位置排列相匹配时,输出匹配识别结果为正确的上述第一匹配识别结果。
作为一种可选的实施方式,本发明实施例中,若第一检测子单元4031检测出文字笔迹的位置排列不与预设位置排列相匹配时,输出子单元4032可以输出匹配识别结果为错误的第一匹配识别结果;
以及,在输出子单元4032输出匹配识别结果为错误的第一匹配识别结果之后,输出子单元4032还可以输出提示信息,以提示用户更改文字笔迹的书写位置排列,并注意书写规范。
相应地,在图5所示的电子设备中,检测子单元4031还用于检测上述文字笔迹是否与上述听写音频节播报的听写内容相匹配。
作为一种可选的实施方式,本发明实施例中,检测子单元4031还可以检测文字笔迹是否与该听写音频节依顺序播报的听写内容相匹配。
举例来说,若当前的听写音频节依顺序播报的听写内容为“家人”,但用户的文字笔迹为“人家”,电子设备可以判断出该文字笔迹不与该听写音频节依顺序播报的听写内容相匹配,输出子单元4032可以输出匹配识别结果为错误的第二匹配识别结果。
相应地,在图5所示的电子设备中,输出子单元4032还用于在检测子单元4031检测出上述文字笔迹与上述听写音频节播报的听写内容相匹配时,输出匹配识别结果为正确的上述第二匹配识别结果。
作为一种可选的实施方式,本发明实施例中,若检测子单元4031检测出文字笔迹不与听写音频节播报的听写内容相匹配时,输出子单元4032可以输出匹配识别结果为错误的第二匹配识别结果;
以及,在输出子单元4032输出匹配识别结果为错误的第二匹配识别结果之后,输出子单元4032还可以输出提示信息,以提示用户的文字笔迹书写错误,请及时做出更改。
相应地,在图5所示的电子设备中,检测子单元4031还用于检测上述文字笔迹的笔顺是否与上述听写音频节播报的听写内容的标准书写笔顺相匹配。
作为一种可选的实施方式,本发明实施例中,电子设备所获取得到的文字笔迹的实际书写笔顺至少包括文字笔迹的实际相对位置、文字笔迹的书写向量方向以及文字笔迹的第一和第二汉字笔画的交叉点;
以及,在电子设备获取得到文字笔迹的实际书写笔顺之后,检测子单元4031可以检测文字笔迹的相对位置、文字笔迹的书写向量方向以及文字笔迹的第一和第二汉字笔画的交叉点是否与目标汉字中笔画书写相符;其中,检测子单元4031可以依次顺序检测,也可以同步检测;
以及,在检测子单元4031进行检测时只要上述任一项不与目标汉字中笔画书写相符,即可确定用户书写有误,而实施本发明实施例,能够有效提高用户输入笔画的检测效率。
相应地,在图5所示的电子设备中,输出子单元4032输出子单元,还用于在上述检测子单元检测出上述文字笔迹的笔顺与上述听写音频节播报的听写内容的标准书写笔顺相匹配时,输出匹配识别结果为正确的上述第三匹配识别结果。
作为一种可选的实施方式,本发明实施例中,若检测子单元4031检测出文字笔迹的笔顺不与听写音频节播报的听写内容的标准书写笔顺相匹配时,输出子单元4032可以输出匹配识别结果为错误的第三匹配识别结果;
以及,在输出子单元4032输出匹配识别结果为错误的第三匹配识别结果之后,输出子单元4032可以将该文字笔迹的标准书写笔顺的书写视频输出至电子设备的显示屏上,以让用户按照该书写视频将该文字笔迹重新书写一遍。
相应地,与图4所示的电子设备相比较,图5所示的电子设备还包括:
第二检测单元407,用于在第一控制单元401控制电子设备执行拍摄操作,以获得第一拍摄图像之后,以及提取单元402从上述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹之前,检测用户在指定时长内是否将上述听写音频节所对应的听写字词书写完毕。
作为一种可选的实施方式,本发明实施例中,在电子设备播报上述听写音频节时,用户能够获取到的只有上述听写音频节所对应的听写字词的发音,当用户无法根据上述听写音频节所对应的听写内容的发音完成听写字词的书写时,用户可以向电子设备发出询问信息以寻求提示。
作为一种可选的实施方式,本发明实施例中,在电子设备播报上述听写音频节之后,电子设备的显示屏可以开始进入倒计时模式,第二检测单元407可检测用户是否在倒计时内书写完毕上述听写字词。
作为一种可选的实施方式,本发明实施例中,上述的指定时长可以默认是由电子设备的系统统一设定;和/或,可以是由用户对应的教师终端或家长终端用户设定;和/或,可以是由用户自行设定。
第一采集单元408,用于在第二检测单元407检测出用户在指定时长内未将上述听写音频节所对应的听写字词书写完毕时,采集上述用户的第一语音信息。
作为一种可选的实施方式,本发明实施例中,用户可以通过语音方式来向电子设备输入需要再次播报上述听写音频节的请求;和/或用户可以通过触屏方式手动来向电子设备输入需要再次播报上述听写音频节的请求;和/或用户可以通过手动开启设置在电子设备上的物理按键开关来向电子设备输入需要再次播报上述听写音频节的请求。
第二识别单元409,用于从上述语音信息中识别出上述用户是否需要再次播报上述听写音频节。
作为一种可选的实施方式,本发明实施例中,第二识别单元409可以对采集到的语音信息进行识别,以识别该语音信息是否存在用于触发电子设备进行再次播报上述听写音频节操作的预设关键字词,例如“听不清楚”、“什么意思”或“再播报一次”等,若存在,电子设备可以判断出用户当前需要再次播报上述听写音频节。
播报单元410,用于在第二识别单元409从上述语音信息中识别出上述用户需要再次播报上述听写音频节时,播报上述听写音频节。
作为一种可选的实施方式,本发明实施例中,在播报单元410播报上述听写音频节之后,电子设备可以检测用户在预设时间内是否将该听写音频节所对应的听写字词书写完毕,若否,电子设备可以输出询问信息,以询问用户是否需要获取该听写字词的提示信息;
以及,若用户需要获取该听写字词的提示信息,电子设备可以播放与上述听写字词相关的提示信息;其中,在电子设备中对于上述听写字词可以具有多个提示信息,电子设备播放提示信息的优先级从高到底可以为与该听写字词有关的提示度。例如,电子设备可以先播放含有少量提示内容的提示信息,再进行检测用户在指定时长内是否书写完毕该听写字词,若否,再播放含有更多提示内容的提示信息;
以及,在电子设备把含有该听写字词的提示信息全部播放完毕之后,电子设备可以进入等待阶段,用户可以在该等待阶段内书写完毕上述听写字词,在该等待阶段结束后,电子设备可以进行播放听写字词所对应的听写音频节。
可见,实施图5所描述的另一种电子设备,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
此外,实施图5所描述的另一种电子设备,能够让用户获悉当前与用户处于同一听写时间的好友,以增加用户与好友之间在学习上的交流,以便提高用户学习的积极性。
此外,实施图5所描述的另一种电子设备,能够有效的避免出现文字笔迹书写潦草凌乱的现象,以提高听写检测的准确率。
此外,实施图5所描述的另一种电子设备,能够有效的提高用户输入笔画的检测效率。
实施例六
请参阅图6,图6是本发明实施例公开的另一种电子设备的结构示意图。其中,图6所示的电子设备是由图5所示的电子设备进行优化得到的。与图5所示的电子设备相比较,图6所示的电子设备还可以包括:
第二控制单元411,用于在第二检测单元407检测用户在指定时长内是否将上述听写音频节所对应的听写字词书写完毕之后,以及第一采集单元408采集用户的第一语音信息之前,若第二检测单元407检测出用户在指定时长内未将上述听写音频节所对应的听写字词书写完毕时,控制摄像设备对用户进行拍摄,以获得含有用户面部图像的第二拍摄图像。
作为一种可选的实施方式,本发明实施例中,电子设备可以装有眼睛聚焦检测装置,该眼睛聚焦检测装置在硬件上可以至少包括摄像头,在软件上可以包括电子设备预先存储的人眼视线估计模型,该人眼视线估计模型能够用于检测用户眼睛的聚焦点位置。
作为一种可选的实施方式,本发明实施例中,在电子设备获取到含有用户面部图像的第二拍摄图像之后,电子设备可以对含有用户面部图像的第二拍摄图像进行分析,进而得到用户的当前情绪类型;
在电子设备得到用户的当前情绪类型之后,电子设备可以判断当前情绪类型是否为低落情绪,若是,电子设备可以停止当前对上述的听写内容进行听写的操作,并可以检测用户当前所处的位置环境是否适合进行改善低落情绪的运动(如散步),若适合,向用户发送提示信息,以便于用户改善低落情绪。
第三检测单元412,用于根据上述第二拍摄图像,检测用户眼睛的聚焦点位置是否在书写页面上。
作为一种可选的实施方式,本发明实施例中,若第三检测单元412检测出用户眼睛的聚焦点位置在书写页面上,但当前用户需要电子设备对上述听写音频节进行再次播报时,电子设备可以控制摄像设备实时采集用户的手部动作,当电子设备检测到用户的手部动作为预设动作时,电子设备可以对上述听写音频节进行再次播报。
作为一种可选的实施方式,本发明实施例中,在实际听写应用场景中,当用户在进行听写字词的书写时,用户的头部会处于低垂的状态,以及用户眼睛的聚焦点位置是在书写页面上的,而当用户将该听写字词书写完毕之后,用户会下意识地抬头看向报读者(在本发明实施例中报读者为电子设备),以便听清下一个听写音频节所播报的内容,进而在本发明实施例中,当第三检测单元412检测到用户眼睛的聚焦点位置不在书写页面上时,电子设备可以检测用户眼睛的聚焦点位置是否在电子设备的显示屏上,若是,即可触发电子设备播报下一听写音频节。
第三控制单元413,用于在第三检测单元412检测出用户眼睛的聚焦点位置未在书写页面上时,控制电子设备输出提示信息,并重复播报上述听写音频节。
作为一种可选的实施方式,本发明实施例中,若第三检测单元412检测出用户眼睛的聚焦点位置不在书写页面上时,电子设备可以判断出用户当前处于精神不集中状态,电子设备可以向电子设备发送提示信息,以提示用户集中精神进行听写。
相应地,与图5所示的电子设备相比较,图6所示的电子设备还包括:
判断单元414,用于在播报单元410播报上述听写音频节之后,判断上述听写字词是否属于预设的易混淆字词。
作为一种可选的实施方式,本发明实施例中,电子设备还可以检测当前所有播报的听写音频节中所对应的听写字词里是否含有与上述听写字词发音相同的同音异义词,例如“报道”与“报到”,若是,判断单元414可以判断出上述听写字词为预设的易混淆字词。
第二采集单元415,用于在判断单元414判断出上述听写字词属于预设的易混淆字词时,采集用户的第二语音信息。
作为一种可选的实施方式,本发明实施例中,用户可以通过语音方式来向电子设备输入需要获取上述听写字词的提示信息;和/或用户可以通过触屏方式手动来向电子设备输入需要获取上述听写字词的提示信息;和/或用户可以通过手动开启设置在电子设备上的物理按键开关来向电子设备输入需要获取上述听写字词的提示信息。
第四检测单元416,用于检测上述第二语音信息是否含有用于触发电子设备进行听写提示操作的预设关键字词。
作为一种可选的实施方式,本发明实施例中,第四检测单元416可以对采集到的语音信息进行识别,以识别该语音信息是否存在用于触发电子设备进行听写提示操作的预设关键字词,例如“不明白”、“什么意思”或“怎么写”等,若存在,电子设备可以判断出用户当前需要获取该听写字词相关的提示信息。
第四控制单元417,用于在第四检测单元416检测出上述第二语音信息含有用于触发上述电子设备进行听写提示操作的预设关键字词时,控制电子设备播放上述听写字词的提示信息。
作为一种可选的实施方式,本发明实施例中,电子设备还可以获取上述听写字词的关联知识点,其中,该关联知识点可以包括:上述听写字词的拼音、偏旁部首、笔画和意思解释;和/或,上述听写字词的近义词、反义词、同义词、例句和用法;和/或,上述听写字词所对应的英文翻译、例句和用法;和/或,上述听写字词所对应的练习题;
以及,在电子设备获取上述听写字词的关联知识点之后,电子设备还可以将上述听写字词的关联知识点输出至电子设备的显示上,以加深用户对上述听写字词的掌握程度。
作为一种可选的实施方式,本发明实施例中,在电子设备将听写结果输出至电子设备的显示屏上之后,电子设备还可以从服务器中获取与用户的听写内容相同的其他用户;
以及,在电子设备从服务器中获取与用户的听写内容相同的其他用户之后,电子设备还可以从服务器中获取其他用户对于上述听写内容的听写成绩;
以及,电子设备还可以判断用户对于上述听写内容的听写成绩是否高于其他用户对于上述听写内容的听写成绩,若否,电子设备可以获取其他用户利用电子设备的学习方式,并可以以此为参照调整用户的学习方式,有利于提高用户的学习效率。
可见,实施图6所描述的另一种电子设备,能够对文字进行多维度的匹配识别,以提高文字识别的准确率,进而提高了听写检测的准确率。
此外,实施图6所描述的另一种电子设备,能够及时获取改善用户低落情绪的方式,避免影响用户在听写过程中的注意力。
此外,实施图6所描述的另一种电子设备,能够加深用户对听写字词的掌握程度。
此外,实施图6所描述的另一种电子设备,能够在用处于精神不集中的状态时给予用户及时的提醒,避免由于用户精神不集中而导致听写检测的失误现象。
此外,实施图6所描述的另一种电子设备,能够提高用户的学习效率。
实施例七
请参阅图7,图7是本发明实施例公开的另一种电子设备的结构示意图。如图7所示,该电子设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行图1~图3任意一种文字识别方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图3任意一种文字识别方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种文字识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种文字识别方法,其特征在于,所述方法包括:
在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像;
从所述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹;
将所述文字笔迹进行位置匹配识别,得到第一匹配识别结果;将所述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果;将所述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果;
根据所述第一匹配识别结果、所述第二匹配识别结果以及所述第三匹配识别结果,计算得到多维度匹配识别的准确率;
检测所述多维度匹配识别的准确率是否达到指定阈值,若是,确定所述文字笔迹书写正确,以及输出听写结果。
2.根据权利要求1所述的文字识别方法,其特征在于,所述将所述文字笔迹进行位置匹配识别,得到第一匹配识别结果,包括:
检测所述文字笔迹的位置排列是否与预设位置排列相匹配;若是,输出匹配识别结果为正确的所述第一匹配识别结果;
以及,所述将所述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果,包括:
检测所述文字笔迹是否与所述听写音频节播报的听写内容相匹配;若是,输出匹配识别结果为正确的所述第二匹配识别结果;
以及,所述将所述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果,包括:
检测所述文字笔迹的笔顺是否与所述听写音频节播报的听写内容的标准书写笔顺相匹配;若是,输出匹配识别结果为正确的所述第三匹配识别结果。
3.根据权利要求2所述的文字识别方法,其特征在于,在控制电子设备执行拍摄操作,以获得第一拍摄图像之后,以及从所述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹之前,所述方法还包括:
检测用户在指定时长内是否将所述听写音频节所对应的听写字词书写完毕;若否,采集所述用户的第一语音信息;
从所述语音信息中识别出所述用户是否需要再次播报所述听写音频节;若是,播报所述听写音频节。
4.根据权利要求3所述的文字识别方法,其特征在于,在检测用户在指定时长内是否将所述听写音频节所对应的听写字词书写完毕之后,以及采集所述用户的第一语音信息之前,所述方法还包括:
若检测出用户在指定时长内未将所述听写音频节所对应的听写字词书写完毕,控制所述摄像设备对所述用户进行拍摄,以获得含有所述用户面部图像的第二拍摄图像;
根据所述第二拍摄图像,检测所述用户眼睛的聚焦点位置是否在书写页面上;若否,控制所述电子设备输出提示信息,并重复播报所述听写音频节。
5.根据权利要求3或4所述的文字识别方法,其特征在于,在播报所述听写音频节之后,所述方法还包括:
判断所述听写字词是否属于预设的易混淆字词;若是,采集所述用户的第二语音信息;
检测所述第二语音信息是否含有用于触发所述电子设备进行听写提示操作的预设关键字词;若是,控制所述电子设备播放所述听写字词的提示信息。
6.一种电子设备,其特征在于,所述电子设备包括:
第一控制单元,用于在检测到电子设备处于听写状态时,控制摄像设备执行拍摄操作,以获得第一拍摄图像;
提取单元,用于从所述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹;
第一识别单元,用于将所述文字笔迹进行位置匹配识别,得到第一匹配识别结果;将所述文字笔迹进行播报顺序匹配识别,得到第二匹配识别结果;将所述文字笔迹进行笔顺的匹配识别,得到第三匹配识别结果;
计算单元,用于根据所述第一匹配识别结果、所述第二匹配识别结果以及所述第三匹配识别结果,计算得到多维度匹配识别的准确率;
第一检测单元,用于检测所述多维度匹配识别的准确率是否达到指定阈值;
确定单元,用于在所述第一检测单元检测出所述多维度匹配识别的准确率达到指定阈值时,确定所述文字笔迹书写正确,以及输出听写结果。
7.根据权利要求6所述的电子设备,其特征在于,所述第一识别单元包括:
检测子单元,用于检测所述文字笔迹的位置排列是否与预设位置排列相匹配;
输出子单元,用于在所述第一检测子单元检测出所述文字笔迹的位置排列与预设位置排列相匹配时,输出匹配识别结果为正确的所述第一匹配识别结果;
所述检测子单元,还用于检测所述文字笔迹是否与所述听写音频节播报的听写内容相匹配;
所述输出子单元,还用于在所述检测子单元检测出所述文字笔迹与所述听写音频节播报的听写内容相匹配时,输出匹配识别结果为正确的所述第二匹配识别结果;
所述检测子单元,还用于检测所述文字笔迹的笔顺是否与所述听写音频节播报的听写内容的标准书写笔顺相匹配;
所述输出子单元,还用于在所述检测子单元检测出所述文字笔迹的笔顺与所述听写音频节播报的听写内容的标准书写笔顺相匹配时,输出匹配识别结果为正确的所述第三匹配识别结果。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:
第二检测单元,用于在所述第一控制单元控制电子设备执行拍摄操作,以获得第一拍摄图像之后,以及所述提取单元从所述第一拍摄图像中提取用户根据播报的听写音频节所书写的文字笔迹之前,检测用户在指定时长内是否将所述听写音频节所对应的听写字词书写完毕;
第一采集单元,用于在所述第二检测单元检测出用户在指定时长内未将所述听写音频节所对应的听写字词书写完毕时,采集所述用户的第一语音信息;
第二识别单元,用于从所述语音信息中识别出所述用户是否需要再次播报所述听写音频节;
播报单元,用于在所述第二识别单元从所述语音信息中识别出所述用户需要再次播报所述听写音频节时,播报所述听写音频节。
9.一种电子设备,其特征在于,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行权利要求1~5任一项所述文字识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1~5任一项所述文字识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910746744.0A CN111079504A (zh) | 2019-08-14 | 2019-08-14 | 一种文字识别方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910746744.0A CN111079504A (zh) | 2019-08-14 | 2019-08-14 | 一种文字识别方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111079504A true CN111079504A (zh) | 2020-04-28 |
Family
ID=70310166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910746744.0A Pending CN111079504A (zh) | 2019-08-14 | 2019-08-14 | 一种文字识别方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079504A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112712737A (zh) * | 2021-01-13 | 2021-04-27 | 百度在线网络技术(北京)有限公司 | 交互方法、装置、设备以及存储介质 |
CN113011412A (zh) * | 2021-04-15 | 2021-06-22 | 深圳市鹰硕云科技有限公司 | 基于笔顺及ocr文字识别方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010150916A1 (en) * | 2009-06-24 | 2010-12-29 | Sharp Kabushiki Kaisha | Handwriting recognition method and device |
CN103400512A (zh) * | 2013-07-16 | 2013-11-20 | 步步高教育电子有限公司 | 一种学习辅助装置及其运行方法 |
US20150106098A1 (en) * | 2012-02-27 | 2015-04-16 | Nec Casio Mobile Communications, Ltd. | Voice input device, voice input method and program |
CN105551341A (zh) * | 2016-02-26 | 2016-05-04 | 广东小天才科技有限公司 | 一种文字描红书写方法和装置 |
CN107301803A (zh) * | 2017-06-29 | 2017-10-27 | 广东小天才科技有限公司 | 一种笔顺纠正方法、装置、终端设备和计算机存储介质 |
CN109635772A (zh) * | 2018-12-20 | 2019-04-16 | 广东小天才科技有限公司 | 一种听写内容的批改方法及电子设备 |
CN109960809A (zh) * | 2019-03-27 | 2019-07-02 | 广东小天才科技有限公司 | 一种听写内容的生成方法及电子设备 |
-
2019
- 2019-08-14 CN CN201910746744.0A patent/CN111079504A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010150916A1 (en) * | 2009-06-24 | 2010-12-29 | Sharp Kabushiki Kaisha | Handwriting recognition method and device |
US20150106098A1 (en) * | 2012-02-27 | 2015-04-16 | Nec Casio Mobile Communications, Ltd. | Voice input device, voice input method and program |
CN103400512A (zh) * | 2013-07-16 | 2013-11-20 | 步步高教育电子有限公司 | 一种学习辅助装置及其运行方法 |
CN105551341A (zh) * | 2016-02-26 | 2016-05-04 | 广东小天才科技有限公司 | 一种文字描红书写方法和装置 |
CN107301803A (zh) * | 2017-06-29 | 2017-10-27 | 广东小天才科技有限公司 | 一种笔顺纠正方法、装置、终端设备和计算机存储介质 |
CN109635772A (zh) * | 2018-12-20 | 2019-04-16 | 广东小天才科技有限公司 | 一种听写内容的批改方法及电子设备 |
CN109960809A (zh) * | 2019-03-27 | 2019-07-02 | 广东小天才科技有限公司 | 一种听写内容的生成方法及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112712737A (zh) * | 2021-01-13 | 2021-04-27 | 百度在线网络技术(北京)有限公司 | 交互方法、装置、设备以及存储介质 |
CN113011412A (zh) * | 2021-04-15 | 2021-06-22 | 深圳市鹰硕云科技有限公司 | 基于笔顺及ocr文字识别方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635772B (zh) | 一种听写内容的批改方法及电子设备 | |
CN109410664B (zh) | 一种发音纠正方法及电子设备 | |
CN103761892B (zh) | 一种语音播放纸质书籍内容的方法及装置 | |
CN109960809B (zh) | 一种听写内容的生成方法及电子设备 | |
CN109446315B (zh) | 一种解题辅助方法及解题辅助客户端 | |
CN109410984B (zh) | 一种朗读评分的方法及电子设备 | |
CN111081080B (zh) | 一种语音检测方法及学习设备 | |
CN111026949A (zh) | 一种基于电子设备的搜题方法及系统 | |
CN111739534B (zh) | 一种辅助语音识别的处理方法、装置、电子设备及存储介质 | |
CN111081103B (zh) | 一种听写答案获取方法、家教设备及存储介质 | |
CN111079504A (zh) | 一种文字识别方法及电子设备 | |
CN111079501B (zh) | 一种文字识别方法及电子设备 | |
CN111026786A (zh) | 一种听写列表生成方法及家教设备 | |
CN111079736B (zh) | 一种听写内容识别方法及电子设备 | |
CN111081227B (zh) | 一种听写内容的识别方法及电子设备 | |
CN111079486A (zh) | 一种开启听写检测的方法及电子设备 | |
CN111079489A (zh) | 一种内容识别方法及电子设备 | |
CN111027353A (zh) | 一种搜索内容的提取方法及电子设备 | |
CN111028590B (zh) | 一种听写过程中引导用户书写的方法及学习设备 | |
CN111079725B (zh) | 一种用于区分英文和拼音的方法及电子设备 | |
CN111078992B (zh) | 一种听写内容生成方法及电子设备 | |
CN109710735B (zh) | 基于多社交渠道的朗读内容推荐方法及电子设备 | |
KR20130137367A (ko) | 이미지 기반 도서 관련 서비스 제공 시스템 및 방법 | |
CN111079414A (zh) | 一种听写检测方法、电子设备及存储介质 | |
CN111028558A (zh) | 一种听写检测方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200428 |