CN111027364A - 一种带印刷体干扰的听写内容识别方法及电子设备 - Google Patents

一种带印刷体干扰的听写内容识别方法及电子设备 Download PDF

Info

Publication number
CN111027364A
CN111027364A CN201910352221.8A CN201910352221A CN111027364A CN 111027364 A CN111027364 A CN 111027364A CN 201910352221 A CN201910352221 A CN 201910352221A CN 111027364 A CN111027364 A CN 111027364A
Authority
CN
China
Prior art keywords
character
dictation
user
numbered musical
musical notation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910352221.8A
Other languages
English (en)
Inventor
魏誉荧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910352221.8A priority Critical patent/CN111027364A/zh
Publication of CN111027364A publication Critical patent/CN111027364A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • G06V30/387Matching; Classification using human interaction, e.g. selection of the best displayed recognition candidate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

一种带印刷体干扰的听写内容识别方法及电子设备,该方法包括:在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出所述区域中的每一字符;根据预先训练生成的印刷体识别模型,识别所述字符的字体是否属于印刷体,若不属于,将所述字符作为手写体字符归类至手写体字符集合;将所述手写体字符集合中的各个手写体字符按照所述各个手写体字符在所述区域中的书写位置进行组合,以获得所述报读音对应的听写内容。实施本发明实施例,能够避免印刷体干扰电子设备对听写内容的识别效果。

Description

一种带印刷体干扰的听写内容识别方法及电子设备
技术领域
本发明涉及教育技术领域,具体涉及一种带印刷体干扰的听写内容识别方法及电子设备。
背景技术
当前,学生用户可以使用电子设备(如家教机、学习平板等)提供的听写应用(又称为听写APP或听写客户端)来报读内容,并且学生用户可以根据该报读内容的报读音去书写听写内容,以提升学生用户对报读内容的掌握程度。在实践中发现,当学生用户根据报读内容的报读音在带印刷体的页面上书写出听写内容时,听写内容带印刷体会干扰电子设备对听写内容的识别效果。
发明内容
本发明实施例公开了一种带印刷体干扰的听写内容识别方法及电子设备,能够避免印刷体干扰电子设备对听写内容的识别效果。
本发明实施例第一方面公开一种带印刷体干扰的听写内容识别方法,所述方法包括:
在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出所述区域中的每一字符;
根据预先训练生成的印刷体识别模型,识别所述字符的字体是否属于印刷体,若不属于,将所述字符作为手写体字符归类至手写体字符集合;
将所述手写体字符集合中的各个手写体字符按照所述各个手写体字符在所述区域中的书写位置进行组合,以获得所述报读音对应的听写内容。
本发明实施例第二方面公开一种电子设备,所述电子设备包括:
字符识别单元,用于在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出所述区域中的每一字符;
印刷体识别单元,用于根据预先训练生成的印刷体识别模型,识别所述字符的字体是否属于印刷体;
字符归类单元,用于在所述印刷体识别单元识别出所述字符的字体不属于印刷体时,将所述字符作为手写体字符归类至手写体字符集合;
字符排序单元,用于将所述手写体字符集合中的各个手写体字符按照所述各个手写体字符在所述区域中的书写位置进行组合,以获得所述报读音对应的听写内容。
本发明实施例第三方面公开一种电子设备,所述电子设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的所述带印刷体干扰的听写内容识别方法的步骤。
本发明实施例第四方面公开一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明实施例第一方面公开的所述带印刷体干扰的听写内容识别方法的步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,可以识别出该区域中的每一字符,并且在根据预先训练生成的印刷体识别模型识别出该字符的字体不属于印刷体时,将该字符作为手写体字符归类至手写体字符集合;在此基础上,可以将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行组合,以获得该报读音对应的听写内容,从而能够避免印刷体干扰电子设备对听写内容的识别效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种带印刷体干扰的听写内容识别方法的流程示意图;
图2是本发明实施例公开的另一种带印刷体干扰的听写内容识别方法的流程示意图;
图3是本发明实施例公开的一种电子设备的结构示意图;
图4是本发明实施例公开的另一种电子设备的结构示意图;
图5是本发明实施例公开的又一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种带印刷体干扰的听写内容识别方法及电子设备,能够避免印刷体干扰电子设备对听写内容的识别效果。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种带印刷体干扰的听写内容识别方法的流程示意图。其中,图1所示的带印刷体干扰的听写内容识别方法可以适用于平板电脑、个人电脑、学习平板、移动手机、家教设备(如家教机)、智能手表(如电话手表)、多媒体教学设备、移动互联网设备(Mobile Internet Device,MID)等各类电子设备。如图1所示,该带印刷体干扰的听写内容识别方法可以包括以下步骤:
101、电子设备在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出该区域中的每一字符。
本发明实施例中,字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字、简谱音符等。
可以理解的是,电子设备可以通过其提供的听写应用(又称为听写APP或听写客户端)输出某一报读音,以待用户(如学生)可以根据某一报读音在某一页面上的、带印刷体的某一区域内进行听写。相应地,电子设备在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,可以通过摄像模组识别出该区域中的每一字符。举例来说,摄像模组可以设置在电子设备上的摄像头,也可以是电子设备通过有线方式或无线方式通信连接的摄像设备(例如电子设备以无线方式通信连接的智能手表上设置的摄像头),本发明实施例不作限定。
作为一种可选的实施方式,电子设备通过其提供的听写应用(又称为听写APP或听写客户端)输出某一报读音的触发方式可以为:
电子设备检测用户针对电子设备安装的某一目标应用的解锁指令;
电子设备响应该解锁指令,判断该目标应用是否属于预设的以听写内容作为应用解锁依据的指定应用,若属于,从所述目标应用配置的报读音库中随机选择某一报读音,并且调用电子设备提供的听写应用输出上述某一报读音。
102、电子设备根据预先训练生成的印刷体识别模型,识别该字符的字体是否属于印刷体,若属于,结束本流程;若不属于,执行步骤103~步骤104。
本发明实施例中,电子设备可以提前收集大量不同字体的印刷体,并通过训练生成印刷体识别模型。
103、电子设备将该字符作为手写体字符归类至手写体字符集合。
作为一种可选的实施方式,电子设备在根据预先训练生成的印刷体识别模型识别出该字符的字体不属于印刷体之后,可以为该用户生成对应于该用户的手写体字符集合,并将该字符作为手写体字符归类至手写体字符集合。
104、电子设备将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行组合,以获得该报读音对应的听写内容。
可以理解的是,各个手写体字符在该区域中的书写位置通常是以行式或列式排列的。当各个手写体字符在该区域中的书写位置以行式排列式时,按照各个手写体字符在该区域中的书写位置进行行式组合,以获得该报读音对应的听写内容;当各个手写体字符在该区域中的书写位置以行式排式时,将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行行式排列组合,以获得该报读音对应的听写内容;当各个手写体字符在该区域中的书写位置以列式排式时,将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行列式排列组合,以获得该报读音对应的听写内容。
本发明实施例中,该报读音对应的听写内容可以作为用户需要解锁的上述目标应用的应用解锁依据,以使得电子设备可以根据该应用解锁依据进行校验是否允许用户解锁上述目标应用,从而可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
可见,实施图1所描述的方法,能够避免印刷体干扰电子设备对听写内容的识别效果。此外,实施图1所描述的方法,可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
实施例二
请参阅图2,图2是本发明实施例公开的另一种带印刷体干扰的听写内容识别方法的流程示意图。如图2所示,该另一种带印刷体干扰的听写内容识别方法可以包括以下步骤:
201、电子设备在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出该区域中的每一字符。
本发明实施例中,电子设备可以通过其提供的听写应用(又称为听写APP或听写客户端)输出某一报读音,以待用户(如学生)可以根据某一报读音在某一页面上的、带印刷体的某一区域内进行听写。相应地,电子设备在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,可以通过摄像模组识别出该区域中的每一字符。
作为一种可选的实施方式,电子设备通过其提供的听写应用(又称为听写APP或听写客户端)输出某一报读音的触发方式可以为:
电子设备检测用户针对电子设备安装的某一目标应用的解锁指令;
电子设备响应该解锁指令,判断该目标应用是否属于预设的以听写内容作为应用解锁依据的指定应用,若属于,从所述目标应用配置的报读音库中随机选择某一报读音,并且调用电子设备提供的听写应用输出上述某一报读音。
202、电子设备根据预先训练生成的印刷体识别模型,识别该字符的字体是否属于印刷体,若属于,结束本流程;若不属于,执行步骤203。
本发明实施例中,电子设备可以提前收集大量字符的不同字体的印刷体,并通过训练生成印刷体识别模型。
203、电子设备根据预先训练生成的该用户的手写体识别模型,识别该字符的字体是否属于该用户的手写体,若不属于,结束本流程;若属于,执行步骤204~步骤205。
本发明实施例中,电子设备可以提前收集该用户手写的字符的手写笔迹,并通过训练生成该用户的手写体识别模型。
204、电子设备将该字符作为手写体字符归类至手写体字符集合。
作为一种可选的实施方式,电子设备在根据预先训练生成的印刷体识别模型识别出该字符的字体不属于印刷体之后,可以为该用户生成对应于该用户的手写体字符集合,并将该字符作为手写体字符归类至手写体字符集合。
205、电子设备将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行组合,以获得该报读音对应的听写内容。
可以理解的是,各个手写体字符在该区域中的书写位置通常是以行式或列式排列的。当各个手写体字符在该区域中的书写位置以行式排列式时,按照各个手写体字符在该区域中的书写位置进行行式组合,以获得该报读音对应的听写内容;当各个手写体字符在该区域中的书写位置以行式排式时,将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行行式排列组合,以获得该报读音对应的听写内容;当各个手写体字符在该区域中的书写位置以列式排式时,将手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行列式排列组合,以获得该报读音对应的听写内容。
本发明实施例中,该报读音对应的听写内容可以作为用户需要解锁的上述目标应用的应用解锁依据,以使得电子设备可以根据该应用解锁依据进行校验是否允许用户解锁上述目标应用,从而可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
作为一种可选的实施方式,上述报读音可以为某一简谱音符串对应的标准发音片段,相应地,当该报读音对应的听写内容作为用户需要解锁的上述目标应用的应用解锁依据时,电子设备可以检测该听写内容是否与该简谱音符串相同,如果相同,电子设备可以为用户解锁上述目标应用;若不相同,电子设备可以向用户讲解该简谱音符串。
例如,上述报读音可以为某一简谱音符串“1243567”对应的标准发音片段“do(多)re(来)fa(发)mi(米)so(梭)la(拉)si(西)”,相应地,当该报读音对应的听写内容作为用户需要解锁的上述目标应用的应用解锁依据时,电子设备可以检测该听写内容是否与该简谱音符串“1243567”相同,如果相同,电子设备可以为用户解锁上述目标应用;若不相同,电子设备可以向用户讲解该简谱音符串“1243567”。
可见,上述实施方式可以实现简谱音符听写训练与应用解锁相融合,从而达到既可以提升简谱音符听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
作为一种可选的实施方式,电子设备向用户讲解该简谱音符串,包括:
电子设备依次输出该简谱音符串包含的各个简谱音符;
以及,在各个简谱音符输出完毕后,依次播放各个简谱音符对应的标准发音。
举例来说,电子设备可以按照简谱音符串“1243567”中的“1”、“2”、“4”、“3”、“5”、“6”以及“7”的拼接顺序,依次输出简谱音符“1”、“2”、“4”、“3”、“5”、“6”以及“7”;以及,在简谱音符“1”、“2”、“4”、“3”、“5”、“6”以及“7”输出完毕后,依次播放简谱音符“1”的标准发音“do(多)”、简谱音符“2”的标准发音“re(来)”、简谱音符“4”的标准发音“fa(发)”、简谱音符“3”的标准“mi(米)”、简谱音符“5”的标准发音“so(梭)”、简谱音符“6”的标准发音“la(拉)”以及简谱音符“7”的标准发音“si(西)”。
作为一种可选的实施方式,本发明实施例中,若检测出该听写内容与该简谱音符串相同,电子设备还可以执行以下步骤:
电子设备通知该用户针对该听写内容发出训练音频;
以及,电子设备将该用户针对该听写内容发出的训练音频的旋律与该简谱音符串对应的标准发音片段的旋律进行比较,获得旋律相似度并输出给该用户进行参考。
作为一种可选的实施方式,上述电子设备检测出该听写内容与该简谱音符串相同之后,以及电子设备为用户解锁上述目标应用之前,电子设备还可以执行以下操作:
电子设备判断获得的上述旋律相似度是否高于指定阈值(如90%),若是,电子设备才为用户解锁上述目标应用;若否,电子设备禁止为用户解锁上述目标应用。
也即是说,在一个实施例中,上述电子设备检测出该听写内容与该简谱音符串相同之后,可以先通知该用户针对该听写内容发出训练音频,以及将该用户针对该听写内容发出的训练音频的旋律与该简谱音符串对应的标准发音片段的旋律进行比较,获得旋律相似度并输出给该用户进行参考;以及,电子设备在判断出获得的上述旋律相似度高于指定阈值(如90%)时,才为用户解锁上述目标应用;若否,电子设备禁止为用户解锁上述目标应用。
可见,上述实施方式可以实现简谱音符听写训练、音频旋律训练与应用解锁相融合,从而达到既可以提升简谱音符听写训练能力和音频旋律训练能力,又可以丰富应用解锁方式,提升用户体验的效果。
可见,实施图2所描述的方法,能够避免印刷体干扰电子设备对听写内容的识别效果。此外,实施图2所描述的方法,可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。此外,实施图2所描述的方法,可以实现简谱音符听写训练、音频旋律训练与应用解锁相融合,从而达到既可以提升简谱音符听写训练能力和音频旋律训练能力,又可以丰富应用解锁方式,提升用户体验的效果。
实施例三
请参阅图3,图3是本发明实施例公开的一种电子设备的结构示意图。其中,图3所示的电子设备可以包括平板电脑、个人电脑、学习平板、移动手机、家教设备(如家教机)、智能手表(如电话手表)、多媒体教学设备、MID等各类电子设备,本发明实施例不作限定。如图3所示,该电子设备可以包括:
字符识别单元301,用于在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出该区域中的每一字符;
印刷体识别单元302,用于根据预先训练生成的印刷体识别模型,识别该字符的字体是否属于印刷体;
字符归类单元303,用于在印刷体识别单元302识别出该字符的字体不属于印刷体时,将该字符作为手写体字符归类至手写体字符集合;
字符排序单元304,用于将该手写体字符集合中的各个手写体字符按照各个手写体字符在该区域中的书写位置进行组合,以获得该报读音对应的听写内容。
作为一种可选的实施方式,电子设备可以通过其提供的听写应用(又称为听写APP或听写客户端)输出某一报读音,以待用户(如学生)可以根据某一报读音在某一页面上的、带印刷体的某一区域内进行听写。相应地,字符识别单元301在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,可以通过摄像模组识别出该区域中的每一字符。举例来说,摄像模组可以设置在电子设备上的摄像头,也可以是电子设备通过有线方式或无线方式通信连接的摄像设备(例如电子设备以无线方式通信连接的智能手表上设置的摄像头),本发明实施例不作限定。
作为一种可选的实施方式,电子设备通过其提供的听写应用(又称为听写APP或听写客户端)输出某一报读音的触发方式可以为:
电子设备检测用户针对电子设备安装的某一目标应用的解锁指令;
电子设备响应该解锁指令,判断该目标应用是否属于预设的以听写内容作为应用解锁依据的指定应用,若属于,从所述目标应用配置的报读音库中随机选择某一报读音,并且调用电子设备提供的听写应用输出上述某一报读音。
作为一种可选的实施方式,字符归类单元303在印刷体识别单元302根据预先训练生成的印刷体识别模型识别出该字符的字体不属于印刷体之后,可以为该用户生成对应于该用户的手写体字符集合,并将该字符作为手写体字符归类至手写体字符集合。
本发明实施例中,该报读音对应的听写内容可以作为用户需要解锁的上述目标应用的应用解锁依据,以使得电子设备可以根据该应用解锁依据进行校验是否允许用户解锁上述目标应用,从而可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
可见,实施图3所描述的电子设备,能够避免印刷体干扰电子设备对听写内容的识别效果。此外,实施图3所描述的电子设备,可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
实施例四
请参阅图4,图4是本发明实施例公开的另一种电子设备的结构示意图。其中,图4所示的电子设备是由图3所示的电子设备进行优化得到的,与图3所示的电子设备相比,图4所示的电子设备还可以包括:
手写体识别单元305,用于在印刷体识别单元302识别出该字符的字体不属于印刷体时,根据预先训练生成的该用户的手写体识别模型,识别该字符的字体是否属于该用户的手写体;
相应地,字符归类单元303具体用于在印刷体识别单元302识别出该字符的字体不属于印刷体时,以及在手写体识别单元305识别出该字符的字体属于该用户的手写体时,将该字符作为手写体字符归类至手写体字符集合。
本发明实施例中,该报读音对应的听写内容可以作为用户需要解锁的上述目标应用的应用解锁依据,以使得电子设备可以根据该应用解锁依据进行校验是否允许用户解锁上述目标应用,从而可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
作为一种可选的实施方式,上述报读音可以为某一简谱音符串对应的标准发音片段,相应地,当该报读音对应的听写内容作为用户需要解锁的上述目标应用的应用解锁依据时,该电子设备还包括:
检测单元306,用于检测该听写内容是否与该简谱音符串相同,如果相同,电子设备可以为用户解锁上述目标应用;
讲解单元307,用于在检测单元306检测出该听写内容与该简谱音符串不相同时,向该用户讲解该简谱音符串。
例如,上述报读音可以为某一简谱音符串“1243567”对应的标准发音片段“do(多)re(来)fa(发)mi(米)so(梭)la(拉)si(西)”,相应地,当该报读音对应的听写内容作为用户需要解锁的上述目标应用的应用解锁依据时,检测单元306可以检测该听写内容是否与该简谱音符串“1243567”相同,如果相同,电子设备可以为用户解锁上述目标应用;若不相同,讲解单元306可以向用户讲解该简谱音符串“1243567”。
可见,上述实施方式可以实现简谱音符听写训练与应用解锁相融合,从而达到既可以提升简谱音符听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。
作为一种可选的实施方式,讲解单元307向用户讲解该简谱音符串,包括:
讲解单元307在检测单元306检测出该听写内容与该简谱音符串不相同时,依次输出该简谱音符串包含的各个简谱音符;以及,在各个简谱音符输出完毕后,依次播放各个简谱音符对应的标准发音。
举例来说,讲解单元307可以按照简谱音符串“1243567”中的“1”、“2”、“4”、“3”、“5”、“6”以及“7”的拼接顺序,依次输出简谱音符“1”、“2”、“4”、“3”、“5”、“6”以及“7”;以及,在简谱音符“1”、“2”、“4”、“3”、“5”、“6”以及“7”输出完毕后,依次播放简谱音符“1”的标准发音“do(多)”、简谱音符“2”的标准发音“re(来)”、简谱音符“4”的标准发音“fa(发)”、简谱音符“3”的标准“mi(米)”、简谱音符“5”的标准发音“so(梭)”、简谱音符“6”的标准发音“la(拉)”以及简谱音符“7”的标准发音“si(西)”。
作为一种可选的实施方式,本发明实施例中,该电子设备还包括:
通知单元308,用于在检测单元306检测出该听写内容与该简谱音符串相同时,通知该用户针对该听写内容发出训练音频,并启动比较单元309;
比较单元309,用于将该用户针对该听写内容发出的训练音频的旋律与该简谱音符串对应的标准发音片段的旋律进行比较,获得旋律相似度并输出给该用户进行参考。
作为一种可选的实施方式,上述检测单元306检测出该听写内容与该简谱音符串相同之后,以及电子设备为用户解锁上述目标应用之前,电子设备还可以执行以下操作:
电子设备判断获得的上述旋律相似度是否高于指定阈值(如90%),若是,电子设备才为用户解锁上述目标应用;若否,电子设备禁止为用户解锁上述目标应用。
也即是说,在一个实施例中,上述检测单元306检测出该听写内容与该简谱音符串相同之后,通知单元308可以先通知该用户针对该听写内容发出训练音频,以及比较单元309将该用户针对该听写内容发出的训练音频的旋律与该简谱音符串对应的标准发音片段的旋律进行比较,获得旋律相似度并输出给该用户进行参考;以及,电子设备在判断出获得的上述旋律相似度高于指定阈值(如90%)时,才为用户解锁上述目标应用;若否,电子设备禁止为用户解锁上述目标应用。
可见,上述实施方式可以实现简谱音符听写训练、音频旋律训练与应用解锁相融合,从而达到既可以提升简谱音符听写训练能力和音频旋律训练能力,又可以丰富应用解锁方式,提升用户体验的效果。
可见,实施图4所描述的电子设备,能够避免印刷体干扰电子设备对听写内容的识别效果。此外,实施图4所描述的电子设备,可以实现听写训练与应用解锁相融合,从而达到既可以提升听写训练能力又可以丰富应用解锁方式,提升用户体验的效果。此外,实施图4所描述的电子设备,可以实现简谱音符听写训练、音频旋律训练与应用解锁相融合,从而达到既可以提升简谱音符听写训练能力和音频旋律训练能力,又可以丰富应用解锁方式,提升用户体验的效果。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。如图5所示,该电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器耦合的处理器502;
其中,处理器502调用存储器801中存储的可执行程序代码,执行图1或图2所描述的带印刷体干扰的听写内容识别方法的步骤。
本发明实施例公开一种计算机可读存储介质,其上存储有计算机指令,该计算机指令运行时执行图1或图2所描述的带印刷体干扰的听写内容识别方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种带印刷体干扰的听写内容识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种带印刷体干扰的听写内容识别方法,其特征在于,所述方法包括:
在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出所述区域中的每一字符;
根据预先训练生成的印刷体识别模型,识别所述字符的字体是否属于印刷体,若不属于,将所述字符作为手写体字符归类至手写体字符集合;
将所述手写体字符集合中的各个手写体字符按照所述各个手写体字符在所述区域中的书写位置进行组合,以获得所述报读音对应的听写内容。
2.根据权利要求1所述的听写内容识别方法,其特征在于,在识别出所述字符的字体不属于印刷体之后,所述方法还包括:
根据预先训练生成的所述用户的手写体识别模型,识别所述字符的字体是否属于所述用户的手写体,若属于,执行所述的将所述字符作为手写体字符归类至手写体字符集合。
3.根据权利要求1或2所述的听写内容识别方法,其特征在于,所述报读音为某一简谱音符串对应的标准发音片段,所述方法还包括:
检测所述听写内容是否与所述简谱音符串相同;
若不相同,向所述用户讲解所述简谱音符串。
4.根据权利要求3所述的听写内容识别方法,其特征在于,所述向所述用户讲解所述简谱音符串,包括:
依次输出所述简谱音符串包含的各个简谱音符;
以及,在所述各个简谱音符输出完毕后,依次播放所述各个简谱音符对应的标准发音。
5.根据权利要求3或4所述的听写内容识别方法,其特征在于,若检测出所述听写内容与所述简谱音符串相同,所述方法还包括:
通知所述用户针对所述听写内容发出训练音频;
以及,将所述用户针对所述听写内容发出的训练音频的旋律与所述简谱音符串对应的标准发音片段的旋律进行比较,获得旋律相似度并输出给所述用户进行参考。
6.一种电子设备,其特征在于,包括:
字符识别单元,用于在用户根据某一报读音在某一页面上的、带印刷体的某一区域内完成听写时,识别出所述区域中的每一字符;
印刷体识别单元,用于根据预先训练生成的印刷体识别模型,识别所述字符的字体是否属于印刷体;
字符归类单元,用于在所述印刷体识别单元识别出所述字符的字体不属于印刷体时,将所述字符作为手写体字符归类至手写体字符集合;
字符排序单元,用于将所述手写体字符集合中的各个手写体字符按照所述各个手写体字符在所述区域中的书写位置进行组合,以获得所述报读音对应的听写内容。
7.根据权利要求6所述的电子设备,其特征在于,所述电子设备还包括:
手写体识别单元,用于在所述印刷体识别单元识别出所述字符的字体不属于印刷体时,根据预先训练生成的所述用户的手写体识别模型,识别所述字符的字体是否属于所述用户的手写体;
所述字符归类单元,具体用于在所述印刷体识别单元识别出所述字符的字体不属于印刷体时,以及在所述手写体识别单元识别出所述字符的字体属于所述用户的手写体时,将所述字符作为手写体字符归类至手写体字符集合。
8.根据权利要求6或7所述的电子设备,其特征在于,所述报读音为某一简谱音符串对应的标准发音片段,所述电子设备还包括:
检测单元,用于检测所述听写内容是否与所述简谱音符串相同;
讲解单元,用于在所述检测单元检测出所述听写内容与所述简谱音符串不相同时,向所述用户讲解所述简谱音符串。
9.根据权利要求8所述的电子设备,其特征在于,所述讲解单元具体用于在所述检测单元检测出所述听写内容与所述简谱音符串不相同时,依次输出所述简谱音符串包含的各个简谱音符;以及,在所述各个简谱音符输出完毕后,依次播放所述各个简谱音符对应的标准发音。
10.根据权利要求8或9所述的电子设备,其特征在于,所述电子设备还包括:
通知单元,用于在所述检测单元检测出所述听写内容与所述简谱音符串相同时,通知所述用户针对所述听写内容发出训练音频;
比较单元,用于将所述用户针对所述听写内容发出的训练音频的旋律与所述简谱音符串对应的标准发音片段的旋律进行比较,获得旋律相似度并输出给所述用户进行参考。
11.一种电子设备,其特征在于,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行权利要求1~5任一项所述的所述带印刷体干扰的听写内容识别方法。
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1~5任一项所述的所述带印刷体干扰的听写内容识别方法。
CN201910352221.8A 2019-04-29 2019-04-29 一种带印刷体干扰的听写内容识别方法及电子设备 Pending CN111027364A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910352221.8A CN111027364A (zh) 2019-04-29 2019-04-29 一种带印刷体干扰的听写内容识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910352221.8A CN111027364A (zh) 2019-04-29 2019-04-29 一种带印刷体干扰的听写内容识别方法及电子设备

Publications (1)

Publication Number Publication Date
CN111027364A true CN111027364A (zh) 2020-04-17

Family

ID=70199518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910352221.8A Pending CN111027364A (zh) 2019-04-29 2019-04-29 一种带印刷体干扰的听写内容识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN111027364A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592045A (zh) * 2021-09-30 2021-11-02 杭州一知智能科技有限公司 从印刷体到手写体的模型自适应文本识别方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106259A (ja) * 2004-10-04 2006-04-20 Jinbao Electron Ind Co Ltd 書き取り教育機能を有する携帯式電子装置及びそれによる書き取り教育の方法
CN102663423A (zh) * 2012-03-28 2012-09-12 北京航空航天大学 一种简谱图像的自动识别和演奏的方法
CN105427696A (zh) * 2015-11-20 2016-03-23 江苏沁恒股份有限公司 一种对目标题目所作答案进行判别的方法
CN108898137A (zh) * 2018-05-25 2018-11-27 黄凯 一种基于深度神经网络的自然图像字符识别方法及系统
CN109558511A (zh) * 2018-12-12 2019-04-02 广东小天才科技有限公司 一种听写报读方法及装置
CN109598272A (zh) * 2019-01-11 2019-04-09 北京字节跳动网络技术有限公司 字符行图像的识别方法、装置、设备及介质
CN109635096A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种听写提示方法及电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106259A (ja) * 2004-10-04 2006-04-20 Jinbao Electron Ind Co Ltd 書き取り教育機能を有する携帯式電子装置及びそれによる書き取り教育の方法
CN102663423A (zh) * 2012-03-28 2012-09-12 北京航空航天大学 一种简谱图像的自动识别和演奏的方法
CN105427696A (zh) * 2015-11-20 2016-03-23 江苏沁恒股份有限公司 一种对目标题目所作答案进行判别的方法
CN108898137A (zh) * 2018-05-25 2018-11-27 黄凯 一种基于深度神经网络的自然图像字符识别方法及系统
CN109558511A (zh) * 2018-12-12 2019-04-02 广东小天才科技有限公司 一种听写报读方法及装置
CN109635096A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种听写提示方法及电子设备
CN109598272A (zh) * 2019-01-11 2019-04-09 北京字节跳动网络技术有限公司 字符行图像的识别方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592045A (zh) * 2021-09-30 2021-11-02 杭州一知智能科技有限公司 从印刷体到手写体的模型自适应文本识别方法和系统
CN113592045B (zh) * 2021-09-30 2022-02-08 杭州一知智能科技有限公司 从印刷体到手写体的模型自适应文本识别方法和系统

Similar Documents

Publication Publication Date Title
CN109460209B (zh) 一种听写报读进度的控制方法及电子设备
CN103761892B (zh) 一种语音播放纸质书籍内容的方法及装置
CN109960809B (zh) 一种听写内容的生成方法及电子设备
CN105931644A (zh) 一种语音识别方法及移动终端
US10102440B2 (en) License plate number input device and method therefor
CN108780542A (zh) 作业支持系统、管理服务器、便携式终端、作业支持方法以及程序
CN105139698A (zh) 一种点读机的信息录入方法及装置
CN112149680B (zh) 错字检测识别方法、装置、电子设备及存储介质
CN105404903B (zh) 信息处理方法、装置及电子设备
CN111081103B (zh) 一种听写答案获取方法、家教设备及存储介质
CN111079501A (zh) 一种文字识别方法及电子设备
CN111027364A (zh) 一种带印刷体干扰的听写内容识别方法及电子设备
CN111079736B (zh) 一种听写内容识别方法及电子设备
CN111079489B (zh) 一种内容识别方法及电子设备
CN115578736A (zh) 证件信息提取方法、装置、存储介质及设备
CN115099222A (zh) 标点符号误用检测纠正方法、装置、设备及存储介质
CN111079725B (zh) 一种用于区分英文和拼音的方法及电子设备
JP6710893B2 (ja) 電子機器およびプログラム
CN110428668B (zh) 一种数据提取方法、装置、计算机系统及可读存储介质
CN104134081A (zh) 一种手写输入内容的拼读方法及装置
CN111079414A (zh) 一种听写检测方法、电子设备及存储介质
CN112231512A (zh) 歌曲标注检测方法、装置和系统及存储介质
CN113053415A (zh) 一种连读的检测方法、装置、设备及存储介质
JPS592191A (ja) 手書き日本語文の認識処理方式
CN111090989A (zh) 一种基于文字识别的提示方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination