CN111091035A - 一种科目识别方法及电子设备 - Google Patents

一种科目识别方法及电子设备 Download PDF

Info

Publication number
CN111091035A
CN111091035A CN201910368074.3A CN201910368074A CN111091035A CN 111091035 A CN111091035 A CN 111091035A CN 201910368074 A CN201910368074 A CN 201910368074A CN 111091035 A CN111091035 A CN 111091035A
Authority
CN
China
Prior art keywords
target
subject
topic
users
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910368074.3A
Other languages
English (en)
Inventor
杨昊民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL China Star Optoelectronics Technology Co Ltd
Original Assignee
Shenzhen China Star Optoelectronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen China Star Optoelectronics Technology Co Ltd filed Critical Shenzhen China Star Optoelectronics Technology Co Ltd
Priority to CN201910368074.3A priority Critical patent/CN111091035A/zh
Publication of CN111091035A publication Critical patent/CN111091035A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例涉及教育技术领域,公开了一种科目识别方法及电子设备,该方法包括:获取海量题目图片,并对海量题目图片进行字符识别,以获得海量题目样本;对海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本;利用海量题目样本和海量标签样本对科目识别模型进行训练,以获得目标科目识别模型;接收当前用户输入的目标题目图片,并对目标题目图片进行字符识别,以获得目标题目信息;将目标题目信息输入目标科目识别模型,以获得目标题目信息对应的目标科目标签。实施本发明实施例,能够提高科目类型的识别准确率。

Description

一种科目识别方法及电子设备
技术领域
本发明涉及教育技术领域,具体涉及一种科目识别方法及电子设备。
背景技术
目前,市面上很多电子设备都设有搜题功能,用以辅助学生们解决学习过程中遇到的疑难问题。学生们在利用电子设备进行搜题时,通常需要将题目图片输入电子设备,使得电子设备从题目图片中识别出待搜索题目,并确定待搜索题目所属的科目类型,从而向用户推送该科目类型对应的学习内容。然而,实践中发现,在对题目图片进行题目识别时,通常会出现字符识别错误,进而降低了科目类型的识别准确率。
发明内容
本发明实施例公开了一种科目识别方法及电子设备,能够提高科目类型的识别准确率。
本发明实施例第一方面公开一种科目识别方法,所述方法包括:
获取海量题目图片,并对所述海量题目图片进行字符识别,以获得海量题目样本;
对所述海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本;
利用所述海量题目样本和所述海量标签样本对科目识别模型进行训练,以获得目标科目识别模型;
接收当前用户输入的目标题目图片,并对所述目标题目图片进行字符识别,以获得目标题目信息;
将所述目标题目信息输入所述目标科目识别模型,以获得所述目标题目信息对应的目标科目标签。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取海量题目图片,并对所述海量题目图片进行字符识别,以获得海量题目样本,包括:
获取海量题目图片,并对所述海量题目图片中每一个题目图片进行多次字符识别,以基于对所述每一个题目图片的多种字符识别结果获得海量题目样本。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获得所述目标题目信息对应的目标科目标签之后,所述方法还包括:
根据所述目标科目标签,确定目标搜索范围;
从所述目标搜索范围中搜索与所述目标题目信息相匹配的目标学习内容,并将所述目标学习内容推送给所述当前用户。
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述目标学习内容推送给所述当前用户之后,所述方法还包括:
利用拍摄装置检测所述拍摄装置的拍摄范围内是否存在除去所述当前用户之外的其他用户;
若存在,检测所述其他用户的视线位置;
若所述其他用户的视线位置属于预设的显示屏区域,获取所述目标学习内容相匹配的讲解音频,并且播放所述讲解音频。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法还包括:
若所述其他用户的视线位置属于所述预设的显示屏区域,判断能否识别出所述其他用户的身份信息;
若是,将所述目标学习内容和所述其他用户的身份信息上报给服务器,以使得所述服务器根据所述其他用户的身份信息,获取所述其他用户对应的用户端的当前使用状态;以及,所述服务器在根据所述当前使用状态,判定出所述其他用户的当前学习科目与所述目标科目标签对应的学习科目相匹配时,将所述目标学习内容推送给所述其他用户对应的用户端,以实现对所述目标学习内容的共享。
本发明实施例第二方面公开一种电子设备,所述电子设备包括:
第一样本获取单元,用于获取海量题目图片,并对所述海量题目图片进行字符识别,以获得海量题目样本;
第二样本获取单元,用于对所述海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本;
训练单元,用于利用所述海量题目样本和所述海量标签样本对科目识别模型进行训练,以获得目标科目识别模型;
字符识别单元,用于接收当前用户输入的目标题目图片,并对所述目标题目图片进行字符识别,以获得目标题目信息;
科目识别单元,用于将所述目标题目信息输入所述目标科目识别模型,以获得所述目标题目信息对应的目标科目标签。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一样本获取单元,具体用于获取海量题目图片,并对所述海量题目图片中每一个题目图片进行多次字符识别,以基于对所述每一个题目图片的多种字符识别结果获得海量题目样本。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
确定单元,用于在所述科目识别单元获得所述目标题目信息对应的目标科目标签之后,根据所述目标科目标签,确定目标搜索范围;
推送单元,用于从所述目标搜索范围中搜索与所述目标题目信息相匹配的目标学习内容,并将所述目标学习内容推送给所述当前用户。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
第一检测单元,用于在所述推送单元将所述目标学习内容推送给所述当前用户之后,利用拍摄装置检测所述拍摄装置的拍摄范围内是否存在除去所述当前用户之外的其他用户;
第二检测单元,用于在所述第一检测单元检测到所述拍摄装置的拍摄范围内存在所述其他用户时,检测所述其他用户的视线位置;
播放单元,用于在所述其他用户的视线位置属于预设的显示屏区域时,获取所述目标学习内容相匹配的讲解音频,并且播放所述讲解音频。
作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:
判断单元,用于在所述其他用户的视线位置属于所述预设的显示屏区域时,判断能否识别出所述其他用户的身份信息;
上报单元,用于在所述判断单元判定出能够识别出所述其他用户的身份信息时,将所述目标学习内容和所述其他用户的身份信息上报给服务器,以使得所述服务器根据所述其他用户的身份信息,获取所述其他用户对应的用户端的当前使用状态;以及,所述服务器在根据所述当前使用状态,判定出所述其他用户的当前学习科目与所述目标科目标签对应的学习科目相匹配时,将所述目标学习内容推送给所述其他用户对应的用户端,以实现对所述目标学习内容的共享。
本发明实施例第三方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的一种科目识别方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种科目识别方法。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,通过对海量题目图片进行字符识别,获得海量题目样本,并且,对海量题目样本中每一个题目样本标上科目标签,获得海量标签样本,能够充分考虑到实际搜题场景中题目图片的不同字符识别效果对科目类型的识别准确度的影响,以将海量题目样本以及海量标签样本作为训练数据集来训练得到目标科目识别模型,从而提高科目类型的识别准确率,以及提高后续推送学习内容的准确率;此外,通过将从题目图片中识别得到的题目信息输入目标科目识别模型,还能够快速获得题目信息对应的科目标签,进而缩小搜题范围,改善了后续的搜题效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种科目识别方法的流程示意图;
图2是本发明实施例公开的另一种科目识别方法的流程示意图;
图3是本发明实施例公开的一种电子设备的结构示意图;
图4是本发明实施例公开的另一种电子设备的结构示意图;
图5是本发明实施例公开的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种科目识别方法及电子设备,能够提高科目类型的识别准确率。本发明实施例公开的科目识别方法适用于供用户使用的学习平板、学习手机、学习机、家教机、点读机等电子设备中,具体地,还适用于上述电子设备内的Web应用、APP或者专用软件。以下结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种科目识别方法的流程示意图。如图1所示,该科目识别方法可以包括以下步骤。
101、电子设备获取海量题目图片,并对海量题目图片进行字符识别,以获得海量题目样本。
本发明实施例中,电子设备可以通过网络爬虫、调用服务器中海量用户上传过的历史题目图片等方式来获取用于训练科目识别模型的海量题目图片,对此不作具体限定。海量题目图片可以包括针对不同科目类型的题目图片,其中,科目类型可以包括语文、数学、英语、物理、化学、生物、地理、历史等,对此亦不作具体限定。此外,电子设备可以通过OCR(Optical Character Recognition,光学字符识别)对海量题目图片进行字符识别,从而将每个题目图片中的文字转换成文本格式,以获得相应的题目样本。
102、电子设备对海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本。
本发明实施例中,电子设备通过分析每一个题目样本所属的科目类型,来为该题目样本标上合适的科目标签,其中,科目类型与科目标签一一对应。举例来说,若题目样本包含拼音、成语、古诗词等内容,比如“《琵琶行》中,‘千呼万唤始出来’的下一句是?”,则电子设备对该题目样本标记的科目标签为语文;若题目样本包含数字、运算符、公式等内容,比如“θ=45°,求sinθ=?”,则电子设备对该题目样本标记的科目标签为数学。
103、电子设备利用海量题目样本和海量标签样本对科目识别模型进行训练,以获得目标科目识别模型。
本发明实施例中,海量题目样本和海量标签样本存在一一对应关系。以海量题目样本为训练数据,以海量标签样本为训练结果,通过将每一个题目样本输入科目识别模型,并不断更新与调整科目识别模型的参数,使得经科目识别模型输出的标签识别结果与该题目样本对应的标签样本一致,从而不断提升科目识别模型的识别准确率,获得目标科目识别模型。
其中,可选的,科目识别模型可以为CNN(Convolution Neural Network,卷积神经网络)模型、RNN(Recurrent Neural Network,循环神经网络)模型或者FastText模型等,对此不作具体限定。
104、电子设备接收当前用户输入的目标题目图片,并对目标题目图片进行字符识别,以获得目标题目信息。
105、电子设备将目标题目信息输入目标科目识别模型,以获得目标题目信息对应的目标科目标签。
作为一种可选的实施方式,目标科目识别模型包括提取模块、判别模块、确定模块,步骤105具体可以包括:
电子设备将目标题目信息输入目标科目识别模型,以通过提取模块提取出目标题目信息的深度特征;以及,通过判决模块将目标题目信息的深度特征与不同科目类型的题目特征进行匹配,以获得匹配度最高的目标科目类型;以及,通过确定模块获取目标科目类型对应的目标科目标签。
可见,实施图1所描述的方法,通过对海量题目图片进行字符识别,获得海量题目样本,并且,对海量题目样本中每一个题目样本标上科目标签,获得海量标签样本,能够充分考虑到实际搜题场景中题目图片的不同字符识别效果对科目类型的识别准确度的影响,以将海量题目样本以及海量标签样本作为训练数据集来训练得到目标科目识别模型,从而提高科目类型的识别准确率,以及提高后续推送学习内容的准确率;此外,通过将从题目图片中识别得到的题目信息输入目标科目识别模型,还能够快速获得题目信息对应的科目标签,进而缩小搜题范围,改善了后续的搜题效率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种科目识别方法的流程示意图。如图2所示,该科目识别方法可以包括以下步骤。
201、电子设备获取海量题目图片,并对海量题目图片中每一个题目图片进行多次字符识别,以基于对每一个题目图片的多种字符识别结果获得海量题目样本。
可以理解,由于题目图片通常为用户手动拍摄的图片,容易存在噪声干扰、图片变形倾斜、图片质量低下(比如图片模糊、光线不足、图片折印、图片部分遮挡)等问题,在对题目图片进行字符识别时,难免出现字符错误、乱码等非正常识别结果。因此,本方案中,为了应对题目图片的非正常识别结果,电子设备通过对同一题目图片进行多次字符识别,将对该题目图片的多种字符识别结果加入题目样本,既能够丰富训练数据集的种类,又能够提高目标科目识别模型的鲁棒性,在对题目图片的非正常识别结果输入目标科目识别模型时,仍能够获得该题目图片对应的正确的科目标签。
202、电子设备对海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本。
203、电子设备利用海量题目样本和海量标签样本对科目识别模型进行训练,以获得目标科目识别模型。
204、电子设备接收当前用户输入的目标题目图片,并对目标题目图片进行字符识别,以获得目标题目信息。
205、电子设备将目标题目信息输入目标科目识别模型,以获得目标题目信息对应的目标科目标签。
206、电子设备根据目标科目标签,确定目标搜索范围。
207、电子设备从目标搜索范围中搜索与目标题目信息相匹配的目标学习内容,并将目标学习内容推送给当前用户。
本发明实施例中,举例来说,若目标科目标签为语文,则电子设备将学习资料库中语文学科对应的所有学习内容作为目标搜索范围;若目标科目标签为化学,则电子设备将学习资料库中化学学科对应的所有学习内容作为目标搜索范围。可见,实施上述步骤206~步骤207,通过获取目标题目信息的科目类型,能够缩小搜题范围,从而提高搜题以及获取学习内容的效率。
208、电子设备利用拍摄装置检测拍摄装置的拍摄范围内是否存在除去当前用户之外的其他用户,若存在,执行步骤209~步骤210。
本发明实施例中,若电子设备利用拍摄装置检测到拍摄装置的拍摄范围内不存在除去当前用户之外的其他用户,结束本流程。可以理解,电子设备可以根据当前用户的人脸特征信息来识别拍摄范围内的当前用户,并在拍摄范围内检测到非当前用户的人脸特征信息时,判定出存在其他用户。
209、电子设备检测其他用户的视线位置。
210、电子设备在其他用户的视线位置属于预设的显示屏区域时,获取目标学习内容相匹配的讲解音频,并且播放该讲解音频。
本发明实施例中,电子设备配置有拍摄装置,拍摄装置可以包括设置于显示屏一面的前置拍摄装置和设置于非显示屏一面的后置拍摄装置。电子设备可以利用前置拍摄装置或者后置拍摄装置中的其中一种或者二者组合来检测其拍摄范围内的其他用户,以及,电子设备还可以利用前置拍摄装置来检测其他用户的视线位置,本发明实施例不作具体限定。
可见,实施上述步骤208~步骤210,通过检测拍摄范围内的其他用户,并在其他用户的视线位置属于预设的显示屏区域时,能够判定出检测到包括当前用户在内的至少两位用户对目标题目信息的学习意图,则默认当前场景为小组学习,此时,通过获取并播放目标学习内容相匹配的讲解音频,能够将学习内容以语音讲解的形式共享给参与小组学习的其他用户,既减少了多名用户同时观看显示屏内容的不便操作,又提高了学习的互动性以及趣味性。
作为一种可选的实施方式,本方案还可以包括以下步骤:
若其他用户的视线位置属于预设的显示屏区域,电子设备判断能否识别出其他用户的身份信息;
若是,电子设备将目标学习内容和其他用户的身份信息上报给服务器,以使得服务器根据其他用户的身份信息,获取其他用户对应的用户端的当前使用状态;以及,服务器在根据上述用户端的当前使用状态,判定出其他用户的当前学习科目与目标科目标签对应的学习科目相匹配时,将目标学习内容推送给其他用户对应的用户端,以实现对目标学习内容的共享。
举例来说,假设目标科目标签为英语,若电子设备识别出其他用户为用户A,则将目标学习内容和用户A的身份信息上传给服务器。服务器根据用户A的身份信息,获取用户A对应的用户端A的当前使用状态;以及,服务器在根据用户端A的当前使用状态,检测到用户端A为启用状态,且当前学习科目也为英语时,将目标学习内容推送给用户端A。其中,其他用户的身份信息可以包括其他用户的生物特征信息(比如人脸特征信息以及声音特征信息)、其他用户的社交账号或者其他用户的学号等,对此不作限定。可见,实施可选的实施方式,在可识别其他用户的身份且其他用户对应的用户端的当前学习科目与目标科目标签匹配时,能够通过服务器直接将目标学习内容推送给其他用户对应的用户端,进而使得其他用户能够在各自的学习设备上观看目标学习内容,进一步改善学习内容共享的高效性。
可选的,电子设备判断能否识别出其他用户的身份信息,包括:
电子设备利用拍摄装置采集其他用户的人脸特征信息,并判断其他用户的人脸特征信息是否与任一已认证用户的人脸特征信息相匹配;若是,则电子设备判定出能够识别出其他用户的身份信息;若否,则电子设备判定出无法识别出其他用户的身份信息。
或者,电子设备利用声音采集设备(比如麦克风)采集其他用户的声音特征信息,并判断其他用户的声音特征信息是否与任一已认证用户的声音特征信息相匹配;若是,则电子设备判定出能够识别出其他用户的身份信息;若否,则电子设备判定出无法识别出其他用户的身份信息。
还可选的,若电子设备判定出无法识别出其他用户的身份信息,则输出用于采集其他用户的身份信息的信息询问页面,并且接收其他用户的账号信息(比如其他用户的身份证号、学号或者相应的用户端编号),以使得电子设备将目标学习内容和其他用户的账号信息上报给服务器,其中,其他用户的账号信息一般与其他用户对应的用户端提前绑定。可见,实施上述可选的实施方式,能够丰富身份识别的途径,提高用户身份的可识别率。
此外,作为一种可选的实施方式,本方案还包括:
在服务器将目标学习内容推送给其他用户对应的客户端之后,电子设备接收服务器返回的推送确认信息;
电子设备新建临时群聊,并将其他用户的账号加入该临时群聊,以使得当前用户和其他用户均可在各自的用户端上利用临时群聊的对话窗口进行学习互动。可以理解,推送确认信息用于指示其他用户对应的用户端满足学习互动条件(即用户端处于启用状态,且当前学习科目与目标科目标签相匹配),因此,当存在多名其他用户时,建立临时群聊,能够在后续的学习交流中,使得参与小组学习的多名用户直接通过临时群聊的对话窗口快速共享学习内容。
可见,实施图2所描述的方法,能够充分考虑到实际搜题场景中题目图片的不同字符识别效果对科目类型的识别准确度的影响,以将海量题目样本以及海量标签样本作为训练数据集来训练得到目标科目识别模型,从而提高科目类型的识别准确率,以及提高后续推送学习内容的准确率;并且,通过对同一题目图片进行多次字符识别,将对该题目图片的多种字符识别结果加入题目样本,既能够丰富训练数据集的种类,又能够提高目标科目识别模型的鲁棒性,在对题目图片的非正常识别结果输入目标科目识别模型时,仍能够获得该题目图片对应的正确的科目标签;此外,还能够快速获得题目信息对应的科目标签,进而缩小搜题范围,提高搜题以及获取学习内容的效率;进一步地,能够将学习内容以语音讲解的形式共享给参与小组学习的其他用户,既减少了多名用户同时观看显示屏内容的不便操作,又提高了学习的互动性以及趣味性;再进一步地,还能够通过服务器直接将目标学习内容推送给其他用户对应的用户端,进而使得其他用户能够在各自的学习设备上观看目标学习内容,进一步改善学习内容共享的高效性。
实施例三
请参阅图3,图3是本发明实施例公开的一种电子设备的结构示意图。如图3所示,该电子设备可以包括第一样本获取单元301、第二样本获取单元302、训练单元303、字符识别单元304以及科目识别单元305,其中:
第一样本获取单元301,用于获取海量题目图片,并对海量题目图片进行字符识别,以获得海量题目样本。
第二样本获取单元302,用于对海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本。
训练单元303,用于利用海量题目样本和海量标签样本对科目识别模型进行训练,以获得目标科目识别模型。
字符识别单元304,用于接收当前用户输入的目标题目图片,并对目标题目图片进行字符识别,以获得目标题目信息。
科目识别单元305,用于将目标题目信息输入目标科目识别模型,以获得目标题目信息对应的目标科目标签。
作为一种可选的实施方式,目标科目识别模型包括提取模块、判别模块、确定模块,科目识别单元305,具体用于将目标题目信息输入目标科目识别模型,以通过提取模块提取出目标题目信息的深度特征;以及,通过判决模块将目标题目信息的深度特征与不同科目类型的题目特征进行匹配,以获得匹配度最高的目标科目类型;以及,通过确定模块获取目标科目类型对应的目标科目标签。
可见,实施图3所示的电子设备,通过对海量题目图片进行字符识别,获得海量题目样本,并且,对海量题目样本中每一个题目样本标上科目标签,获得海量标签样本,能够充分考虑到实际搜题场景中题目图片的不同字符识别效果对科目类型的识别准确度的影响,以将海量题目样本以及海量标签样本作为训练数据集来训练得到目标科目识别模型,从而提高科目类型的识别准确率,以及提高后续推送学习内容的准确率;此外,通过将从题目图片中识别得到的题目信息输入目标科目识别模型,还能够快速获得题目信息对应的科目标签,进而缩小搜题范围,改善了后续的搜题效率。
实施例四
请参阅图4,图4是本发明实施例公开的另一种电子设备的结构示意图。其中,图4所示的电子设备是由图3所示的电子设备进行优化得到的。与图3所示的电子设备相比较,图4所示的电子设备还包括确定单元306、推送单元307、第一检测单元308、第二检测单元309以及播放单元310,其中:
第一样本获取单元301,具体用于获取海量题目图片,并对海量题目图片中每一个题目图片进行多次字符识别,以基于对每一个题目图片的多种字符识别结果获得海量题目样本。
确定单元306,用于在科目识别单元305获得目标题目信息对应的目标科目标签之后,根据目标科目标签,确定目标搜索范围。
推送单元307,用于从目标搜索范围中搜索与目标题目信息相匹配的目标学习内容,并将目标学习内容推送给当前用户。
第一检测单元308,用于在推送单元307将目标学习内容推送给当前用户之后,利用拍摄装置检测拍摄装置的拍摄范围内是否存在除去当前用户之外的其他用户。
第二检测单元309,用于在第一检测单元308检测到拍摄装置的拍摄范围内存在其他用户时,检测其他用户的视线位置。
播放单元310,用于在其他用户的视线位置属于预设的显示屏区域时,获取目标学习内容相匹配的讲解音频,并且播放该讲解音频。
作为一种可选的实施方式,该电子设备还可以包括:
判断单元311,用于在其他用户的视线位置属于预设的显示屏区域时,判断能否识别出其他用户的身份信息;
上报单元312,用于在判断单元311判定出能够识别出其他用户的身份信息时,将目标学习内容和其他用户的身份信息上报给服务器,以使得服务器根据其他用户的身份信息,获取其他用户对应的用户端的当前使用状态;以及,服务器在根据上述用户端的当前使用状态,判定出其他用户的当前学习科目与目标科目标签对应的学习科目相匹配时,将目标学习内容推送给其他用户对应的用户端,以实现对目标学习内容的共享。
可选的,判断单元311,包括:
第一采集子单元,用于在其他用户的视线位置属于预设的显示屏区域时,利用拍摄装置采集其他用户的人脸特征信息;
第一判断子单元,用于判断其他用户的人脸特征信息是否与任一已认证用户的人脸特征信息相匹配;若是,则电子设备判定出能够识别出其他用户的身份信息;若否,则电子设备判定出无法识别出其他用户的身份信息。
第二采集子单元,用于利用声音采集设备(比如麦克风)采集其他用户的声音特征信息;
第二判断子单元,用于判断其他用户的声音特征信息是否与任一已认证用户的声音特征信息相匹配;若是,则电子设备判定出能够识别出其他用户的身份信息;若否,则电子设备判定出无法识别出其他用户的身份信息。
还可选的,该电子设备还包括:
输出单元,用于在判断单元311判定出无法识别出其他用户的身份信息时,输出用于采集其他用户的身份信息的信息询问页面;
第一接收单元,用于接收其他用户的账号信息(比如其他用户的身份证号、学号以及相应的用户端编号);
上报单元312,还用于将目标学习内容和其他用户的账号信息上报给服务器,其中,其他用户的账号信息一般与其他用户对应的用户端提前绑定。可见,实施上述可选的实施方式,能够丰富身份识别的途径,提高用户身份的可识别率。
此外,作为一种可选的实施方式,该电子设备还包括:
第二接收单元,还用于在服务器将目标学习内容推送给其他用户对应的客户端之后,接收服务器返回的推送确认信息;
群聊建立单元,用于新建临时群聊,并将其他用户的账号加入该临时群聊,以使得当前用户和其他用户均可在各自的用户端上利用临时群聊的对话窗口进行学习互动。可以理解,推送确认信息用于指示其他用户对应的用户端满足学习互动条件(即用户端处于启用状态,且当前学习科目与目标科目标签相匹配),因此,当存在多名其他用户时,建立临时群聊,能够在后续的学习交流中,使得参与小组学习的多名用户直接通过临时群聊的对话窗口快速共享学习内容。
可见,实施图4所示的电子设备,能够充分考虑到实际搜题场景中题目图片的不同字符识别效果对科目类型的识别准确度的影响,以将海量题目样本以及海量标签样本作为训练数据集来训练得到目标科目识别模型,从而提高科目类型的识别准确率,以及提高后续推送学习内容的准确率;并且,通过对同一题目图片进行多次字符识别,将对该题目图片的多种字符识别结果加入题目样本,既能够丰富训练数据集的种类,又能够提高目标科目识别模型的鲁棒性,在对题目图片的非正常识别结果输入目标科目识别模型时,仍能够获得该题目图片对应的正确的科目标签;此外,还能够快速获得题目信息对应的科目标签,进而缩小搜题范围,提高搜题以及获取学习内容的效率;进一步地,能够将学习内容以语音讲解的形式共享给参与小组学习的其他用户,既减少了多名用户同时观看显示屏内容的不便操作,又提高了学习的互动性以及趣味性;再进一步地,还能够通过服务器直接将目标学习内容推送给其他用户对应的用户端,进而使得其他用户能够在各自的学习设备上观看目标学习内容,进一步改善学习内容共享的高效性。
实施例五
请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。如图5所示,该电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1或图2所示的一种科目识别方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1或图2所示的一种科目识别方法。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本发明实施例还公开一种应用发布平台,该应用发布平台用于发布计算机程序产品,其中,当上述计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种科目识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种科目识别方法,其特征在于,所述方法包括:
获取海量题目图片,并对所述海量题目图片进行字符识别,以获得海量题目样本;
对所述海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本;
利用所述海量题目样本和所述海量标签样本对科目识别模型进行训练,以获得目标科目识别模型;
接收当前用户输入的目标题目图片,并对所述目标题目图片进行字符识别,以获得目标题目信息;
将所述目标题目信息输入所述目标科目识别模型,以获得所述目标题目信息对应的目标科目标签。
2.根据权利要求1所述的方法,其特征在于,所述获取海量题目图片,并对所述海量题目图片进行字符识别,以获得海量题目样本,包括:
获取海量题目图片,并对所述海量题目图片中每一个题目图片进行多次字符识别,以基于对所述每一个题目图片的多种字符识别结果获得海量题目样本。
3.根据权利要求1或2所述的方法,其特征在于,所述获得所述目标题目信息对应的目标科目标签之后,所述方法还包括:
根据所述目标科目标签,确定目标搜索范围;
从所述目标搜索范围中搜索与所述目标题目信息相匹配的目标学习内容,并将所述目标学习内容推送给所述当前用户。
4.根据权利要求3所述的方法,其特征在于,所述将所述目标学习内容推送给所述当前用户之后,所述方法还包括:
利用拍摄装置检测所述拍摄装置的拍摄范围内是否存在除去所述当前用户之外的其他用户;
若存在,检测所述其他用户的视线位置;
若所述其他用户的视线位置属于预设的显示屏区域,获取所述目标学习内容相匹配的讲解音频,并且播放所述讲解音频。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述其他用户的视线位置属于所述预设的显示屏区域,判断能否识别出所述其他用户的身份信息;
若是,将所述目标学习内容和所述其他用户的身份信息上报给服务器,以使得所述服务器根据所述其他用户的身份信息,获取所述其他用户对应的用户端的当前使用状态;以及,所述服务器在根据所述当前使用状态,判定出所述其他用户的当前学习科目与所述目标科目标签对应的学习科目相匹配时,将所述目标学习内容推送给所述其他用户对应的用户端,以实现对所述目标学习内容的共享。
6.一种电子设备,其特征在于,所述电子设备包括:
第一样本获取单元,用于获取海量题目图片,并对所述海量题目图片进行字符识别,以获得海量题目样本;
第二样本获取单元,用于对所述海量题目样本中每一个题目样本标上科目标签,以获得海量标签样本;
训练单元,用于利用所述海量题目样本和所述海量标签样本对科目识别模型进行训练,以获得目标科目识别模型;
字符识别单元,用于接收当前用户输入的目标题目图片,并对所述目标题目图片进行字符识别,以获得目标题目信息;
科目识别单元,用于将所述目标题目信息输入所述目标科目识别模型,以获得所述目标题目信息对应的目标科目标签。
7.根据权利要求6所述的电子设备,其特征在于,所述第一样本获取单元,具体用于获取海量题目图片,并对所述海量题目图片中每一个题目图片进行多次字符识别,以基于对所述每一个题目图片的多种字符识别结果获得海量题目样本。
8.根据权利要求6或7所述的电子设备,其特征在于,所述电子设备还包括:
确定单元,用于在所述科目识别单元获得所述目标题目信息对应的目标科目标签之后,根据所述目标科目标签,确定目标搜索范围;
推送单元,用于从所述目标搜索范围中搜索与所述目标题目信息相匹配的目标学习内容,并将所述目标学习内容推送给所述当前用户。
9.根据权利要求8所述的电子设备,其特征在于,所述电子设备还包括:
第一检测单元,用于在所述推送单元将所述目标学习内容推送给所述当前用户之后,利用拍摄装置检测所述拍摄装置的拍摄范围内是否存在除去所述当前用户之外的其他用户;
第二检测单元,用于在所述第一检测单元检测到所述拍摄装置的拍摄范围内存在所述其他用户时,检测所述其他用户的视线位置;
播放单元,用于在所述其他用户的视线位置属于预设的显示屏区域时,获取所述目标学习内容相匹配的讲解音频,并且播放所述讲解音频。
10.根据权利要求9所述的电子设备,其特征在于,所述电子设备还包括:
判断单元,用于在所述其他用户的视线位置属于所述预设的显示屏区域时,判断能否识别出所述其他用户的身份信息;
上报单元,用于在所述判断单元判定出能够识别出所述其他用户的身份信息时,将所述目标学习内容和所述其他用户的身份信息上报给服务器,以使得所述服务器根据所述其他用户的身份信息,获取所述其他用户对应的用户端的当前使用状态;以及,所述服务器在根据所述当前使用状态,判定出所述其他用户的当前学习科目与所述目标科目标签对应的学习科目相匹配时,将所述目标学习内容推送给所述其他用户对应的用户端,以实现对所述目标学习内容的共享。
CN201910368074.3A 2019-05-05 2019-05-05 一种科目识别方法及电子设备 Pending CN111091035A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910368074.3A CN111091035A (zh) 2019-05-05 2019-05-05 一种科目识别方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910368074.3A CN111091035A (zh) 2019-05-05 2019-05-05 一种科目识别方法及电子设备

Publications (1)

Publication Number Publication Date
CN111091035A true CN111091035A (zh) 2020-05-01

Family

ID=70392982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910368074.3A Pending CN111091035A (zh) 2019-05-05 2019-05-05 一种科目识别方法及电子设备

Country Status (1)

Country Link
CN (1) CN111091035A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581367A (zh) * 2020-05-11 2020-08-25 广东小天才科技有限公司 一种题目录入的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109545015A (zh) * 2019-01-23 2019-03-29 广东小天才科技有限公司 一种科目类型的识别方法及家教设备
CN109614552A (zh) * 2018-12-17 2019-04-12 广东小天才科技有限公司 一种引导式搜索方法及引导式搜索系统
CN109635214A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种学习资源的推送方法及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614552A (zh) * 2018-12-17 2019-04-12 广东小天才科技有限公司 一种引导式搜索方法及引导式搜索系统
CN109635214A (zh) * 2018-12-20 2019-04-16 广东小天才科技有限公司 一种学习资源的推送方法及电子设备
CN109545015A (zh) * 2019-01-23 2019-03-29 广东小天才科技有限公司 一种科目类型的识别方法及家教设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581367A (zh) * 2020-05-11 2020-08-25 广东小天才科技有限公司 一种题目录入的方法和系统

Similar Documents

Publication Publication Date Title
CN109597943B (zh) 一种基于场景的学习内容推荐方法及学习设备
CN109410664B (zh) 一种发音纠正方法及电子设备
KR20180122926A (ko) 학습 서비스 제공 방법 및 그 장치
CN109446315B (zh) 一种解题辅助方法及解题辅助客户端
US20220375225A1 (en) Video Segmentation Method and Apparatus, Device, and Medium
CN108197300B (zh) 一种搜题方法及系统
CN109766412B (zh) 一种基于图像识别的学习内容获取方法及电子设备
CN111191067A (zh) 绘本识别方法、终端设备及计算机可读存储介质
CN107977394B (zh) 绘本识别方法及电子设备
CN113469298B (zh) 模型训练方法及资源推荐方法
CN111026949A (zh) 一种基于电子设备的搜题方法及系统
CN111460185A (zh) 书籍搜索方法、装置和系统
CN109410984B (zh) 一种朗读评分的方法及电子设备
CN111079499B (zh) 一种学习环境中的书写内容识别方法及系统
CN111427990A (zh) 一种智慧校园教学辅助的智能考试控制系统及方法
CN111126071A (zh) 提问文本数据的确定方法、装置和客服群的数据处理方法
CN106326260A (zh) 网页访问方法及装置
CN111026924A (zh) 一种待搜索内容的获取方法及电子设备
CN111091035A (zh) 一种科目识别方法及电子设备
CN110059184B (zh) 一种作业错题收集分析方法及系统
CN111081092B (zh) 一种学习内容输出方法及学习设备
CN111933133A (zh) 智能客服应答的方法及装置、电子设备、存储介质
CN112309389A (zh) 信息交互方法和装置
CN110929519B (zh) 实体属性抽取方法及装置
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200501