CN108153915A - 一种基于互联网的教育信息快速获取方法 - Google Patents

一种基于互联网的教育信息快速获取方法 Download PDF

Info

Publication number
CN108153915A
CN108153915A CN201810082771.8A CN201810082771A CN108153915A CN 108153915 A CN108153915 A CN 108153915A CN 201810082771 A CN201810082771 A CN 201810082771A CN 108153915 A CN108153915 A CN 108153915A
Authority
CN
China
Prior art keywords
topic
text
search
type
cursor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810082771.8A
Other languages
English (en)
Other versions
CN108153915B (zh
Inventor
赵宇航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing shupeitong Network Technology Co.,Ltd.
Original Assignee
赵宇航
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 赵宇航 filed Critical 赵宇航
Priority to CN201810082771.8A priority Critical patent/CN108153915B/zh
Publication of CN108153915A publication Critical patent/CN108153915A/zh
Application granted granted Critical
Publication of CN108153915B publication Critical patent/CN108153915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种基于互联网的教育信息快速获取方法,所述方法设置多个题目搜索的数据库和搜索引擎及其优先级关系,有效整合了各个数据资源,提高了搜索结果的准确性,提高了搜索效率;基于光标所在位置解析出题目类型,从而提高了搜索的针对性和搜索效率;对当前页面的文本进行分析进而获取多个题目,可以在一个页面上搜索多个题目,从而提高了搜索的效率;此外,设置了搜索的数据库和搜索引擎的优先级,可以提高搜索的个性化和搜索的灵活性,满足不同用户的不同搜索需求;最后,根据页面控件自动触发题目解析的后续动作,提高了题目解析的效率。

Description

一种基于互联网的教育信息快速获取方法
技术领域
本申请涉及本发明涉及教育和互联网技术领域,尤其涉及一种基于互联网的教育信息快速获取方法。
背景技术
现在电子产品越来越普及,用智能终端产品,如手机和平板电脑等摄像功能将难题拍摄下来并寻求网络答疑的方法得到了广泛的应用,但是现有方法在拍摄到难题之后,需要用户手动拉拽剪贴框选来选择目标区域,这个操作往往需要很多的时间和精力,而且拖拽选取题目不易操作并且也不够准确,手动拖拽往往容易造成框多或者框少的问题,导致寻求答案过程变得困难、缓慢甚至还会造成解答错误的情况,如今学生学业繁重,应尽量减轻学生寻求答疑的难度。
目前,市面上的很多电子教育产品都可以实现拍照搜题功能,通过拍摄单词或词组以搜索对应的释义,或者通过拍摄题目以搜索对应的答案。现有拍照搜题功能的实现大都需要经过以下步骤:启动摄像头-拍照-在图像中截取搜索对象-通过OCR技术将搜索对象转换成文本-服务器搜索并匹配搜索结果-服务器将搜索结果反馈给电子终端。然而,用户在拍题时,往往拍出来的图像中有很多道题,现有技术通过固定的截题框截取用户想要的那道题,操作比较繁琐且容易出错。
针对上述问题,文献CN106326415A提供一种以通过光标定位的方式获取拍摄对象以及试题文本块,操作简单且可有效提高试题截取的精度,而且省去了截题确认的步骤,优化了整个拍照搜题的流程,增强用户体验。
文献CN106295514A通过应用扫描课本图片识别技术的APP,在进行同步学习辅导或搜索教材某页内容时,无需按书本科目、版本和年级来搜索教材,再逐页寻找所需的内容,无需浪费流量整本下载,只需要轻轻一扫就能精准定位到需要的课文页面,进行同步作业辅导。
然而,上述两种方法也存在许多缺陷,首先,上述方法虽然对图片拍摄进行了改进,然而并未对服务器侧的资源进行整合,由此难免会造成资源的搜索结果难以满足多样化题目需求;其次,上述方法仅仅对题目获取过程进行改进,而在搜索题目过程未对搜索部分进行优化,可能会导致搜索的效率不高、搜索的结果不准确的问题;最后,上述对拍摄图像处理获取题目的方法需要借助于用户手动触发光标的位置改变来实现,因此,这种手动获取题目的方法效率低下,智能化程度低,难以满足用户的自动化需求。
发明内容
本发明提供一种基于互联网的教育信息快速获取方法,所述方法包括如下步骤:
S1,用户通过移动终端设置题目搜索的数据库和搜索引擎及其优先级关系;所述数据库和所述搜索引擎分别有一个或者多个;
S2,所述移动终端接收所述用户是否进入题目搜索模式,如果进入题目搜索模式,则检测所述题目搜索模式下当前光标所在位置,如果所述光标在文本区域,则进入步骤S3,如果所述光标不在文本区域,则提示所述用户移动所述光标到文本区域;如果未进入题目搜索模式,则不做任何处理;
S3,基于所述光标所在的当前位置判断所述光标是否位于题目所在文本区域,如果是,则获取所述题目所在的文本区域的文本,并基于所述文本自动判断所述题目的类型和所述题目的内容,并将所述题目的类型信息标记到对应的所述题目的内容;
S4,基于所述题目的类型信息分别在第一优先级的所述数据库和第一优先级的所述搜索引擎中对所述题目进行搜索,并将所述数据库中的搜索结果A1和所述搜索引擎中的搜索结果B1进行比较,如果数据库搜索结果A1和搜索引擎搜索结果B1一致,则将所述搜索结果A1或者B1通过所述移动终端反馈给所述用户,并将所述搜索结果展示在所述光标所在位置;如果数据库搜索结果A1和搜索引擎搜索结果B1不一致,则进入步骤S5;
S5,基于所述题目的类型信息分别在第二优先级的所述数据库和第二优先级的所述搜索引擎中对所述题目进行搜索,得到所述数据库中的搜索结果A2和所述搜索引擎中的搜索结果B2,将所述搜索结果A1、B1、A1、B2进行比较,如果出现次数最多的所述搜索结果仅有一个,则将出现次数最多的所述搜索结果提供给所述用户,并将所述搜索结果展示在所述光标所在位置;如果出现次数最多的所述搜索结果有多个,则向所述用户反馈错误信息,并将出现次数最多的多个所述搜索结果提供给所述用户。
作为一种优选的实施方式,所述用户通过移动终端设置题目搜索的数据库和搜索引擎及其优先级关系,具体包括:
根据所述用户的历史设置信息或者服务器侧的排名信息通过移动终端为所述用户推荐设置题目搜索的多个数据库及其优先级关系、多个搜索引擎及其优先级关系;在接收到所述题目搜索的指令后同一优先级的所述数据库和所述搜索引擎同时触发搜索操作;所述数据库包括本地数据库和互联网数据库。
作为一种优选的实施方式,所述基于所述光标所在的当前位置判断所述光标是否位于题目所在文本区域,具体包括:
设置题目类型对应的语法模型,每一个所述题目类型对应一种或者多种所述语法模型;
基于所述光标所在的当前位置获取所述光标所在段落的文本信息,基于所述文本信息判断所述文本是否属于所述语法模型中的一种,如果所述文本属于所述语法模型中的一种,则所述光标位于所述题目所在文本区域;如果所述文本不属于所述语法模型中的一种,则所述光标不在所述题目所在文本区域。
作为一种优选的实施方式,所述题目的类型包括以下任意一种或者几种:填空题、判断题、选择题、问答题;所述分割区域的图像的数量作为所述题目的数量。
作为一种优选的实施方式,所述获取所述题目所在的文本区域的文本,基于所述文本自动判断所述题目的类型和所述题目的内容,具体包括:
S31,设置题目类型对应的题目模型,每一个所述题目模型对应一种或者多种所述语法模型;
S32,获取所述光标所在段落的文本信息,判断所述文本信息是否符合所述题目模型,如果符合,则进入步骤S33;如果不符合,判断所述文本信息是否属于所述语法模型,如果属于,则进入步骤S33;如果不属于,则进入步骤S34;
S33,根据所述题目的类型在对应优先级的所述数据库的所述题目的类型的子数据库中进行搜索;将所述题目的类型转换为文字信息,基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索;
S34,判断所述段落的段首和短尾的回车符所在位置,基于所述回车符获取所述段落的前一段和后一段的文本信息,基于所述前一段、所述段落、所述后一段的文本信息判断所述文本信息是否符合所述题目模型,如果符合,则返回步骤S33;如果不符合,判断所述文本信息是否属于所述语法模型,如果属于,则返回步骤S33;如果不属于,则为所述用户提示错误信息。
作为一种优选的实施方式,所述获取所述题目所在的文本区域的文本,基于所述文本自动判断所述题目的类型和所述题目的内容,具体包括:
获取所述题目所在的文本区域的文本,基于所述文本向上和/或向下识别相邻区域的文本,基于所述相邻区域的文本判断所述题目的数量,如果所述题目的数量有多个,则基于所述相邻区域的文本自动拆分出每一个所述题目所在的文本区域,并根据所述文本区域的文本判断每一个对应所述题目的类型;对每一个所述题目按照流水线的方式根据所述题目的类型在对应优先级的所述数据库的所述题目的类型的子数据库中进行搜索;将每一个所述题目的类型转换为文字信息,对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索。
作为一种优选的实施方式,所述对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索,还包括:
对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索,将所述搜索结果保存在缓存中,当所述用户将所述光标移到到所述题目所在的文本区域后,将所述题目对应的搜索结果展示在所述光标的附近。
作为一种优选的实施方式,为不同所述题目类型和/或不同所述题目设置不同的搜索结果展示方式,所述搜索结果展示方式包括颜色、字体、大小中的一种或者几种。
作为一种优选的实施方式,将出现次数最多的所述搜索结果提供给所述用户,或者,将出现次数最多的多个所述搜索结果提供给所述用户,具体包括:
检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签;如果没有所述控件标签,则将所述搜索结果提供给所述用户。
作为一种优选的实施方式,所述检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签,还包括:
检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签;
检测所述题目所在文本区域是否有所述搜索结果对应的所述控件标签以外的所述交互式控件标签,如果有所述控件标签,则根据所述控件标签的属性信息判断所述控件标签的类型,基于所述控件标签的类型使能当前页面前进的所述控件标签。
本发明提供一种基于互联网的教育信息快速获取方法,所述方法设置多个题目搜索的数据库和搜索引擎及其优先级关系,有效整合了各个数据资源,提高了搜索结果的准确性,提高了搜索效率;基于光标所在位置解析出题目类型,从而提高了搜索的针对性和搜索效率;对当前页面的文本进行分析进而获取多个题目,可以在一个页面上搜索多个题目,从而提高了搜索的效率;此外,设置了搜索的数据库和搜索引擎的优先级,可以提高搜索的个性化和搜索的灵活性,满足不同用户的不同搜索需求;最后,根据页面控件自动触发题目解析的后续动作,提高了题目解析的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的一种基于互联网的教育信息快速获取方法的步骤示意图。
具体实施方式
以下结合附图进一步说明本发明的实施例。
实施例一:
如图1所示,本发明提供一种基于互联网的教育信息快速获取方法,所述方法包括如下步骤:
S1,用户通过移动终端设置题目搜索的数据库和搜索引擎及其优先级关系;所述数据库和所述搜索引擎分别有一个或者多个;需要说明的是,上述设置是在进行题目搜索以前进行的,示例性的,上述数据库可以为用户在其移动终端的其他应用程序内进行题目练习过程中保存的错题数据库或者直接调用其他答题练习应用程序的练习题数据库,此时,需要改移动终端获取相应的数据库读取权限,以获取上述多种不同的数据库内的题目及其答案。此外,上述搜索引擎都是基于互联网实现的,示例性的,上述搜索引擎为百度、谷歌、360等其中的一种或者多种;一旦设置了上述数据库和搜索引擎的优先级关系,在进行搜索过程中则可以直接调用对应的数据库和搜索引擎进行搜索,而不必手动先从图像中解析出文字,再将文字复制到搜索窗口进而执行搜索操作;即本发明直接自动将解析出的文字信息提取关键词、执行搜索,从而提高了搜索的效率,避免了用户手动操作的繁琐步骤。
S2,所述移动终端接收所述用户是否进入题目搜索模式,如果进入题目搜索模式,则检测所述题目搜索模式下当前光标所在位置,如果所述光标在文本区域,则进入步骤S3,如果所述光标不在文本区域,则提示所述用户移动所述光标到文本区域;如果未进入题目搜索模式,则不做任何处理;需要说明的是,所述题目搜索模式的进入端口可以是右键、长按或者相应的功能按钮,在此不做限制;由于题目的检测是基于光标所在位置进行的,因此,如果用户没有触发光标的闪动状态或者光标在图片上,此时无法识别从哪里开始检测题目的文本,因此,需要基于光标位置进行文本的上下文检测,以识别题目的文本信息;此外,光标所在位置可以在题目的题干区域、答题区域、选项区域,甚至是两个题目的中间区域,在此不做限制。
S3,基于所述光标所在的当前位置判断所述光标是否位于题目所在文本区域,如果是,则获取所述题目所在的文本区域的文本,并基于所述文本自动判断所述题目的类型和所述题目的内容,并将所述题目的类型信息标记到对应的所述题目的内容;需要说明的是,所述获取所述题目所在的文本区域的文本具体为:获取所述题目所在的文本区域的文本中的文字、数字或公式。所述题目的类型信息标记信息具体为题目所在的行列、标题、序号等特殊标记判断出的每一个相对独立的文本区域作为一道题目。优选的,根据解析得到题目所在行列、标题的上下位置、行列缩进关系、序号等信息判断题目的类型,例如一级标题中关键词“判断”,上述一级标题下部的行列缩进关系标识的多个二级标题出现了序号1/2等,则识别序号1/2后的题目类型为判断题,序号1/2表明有2道选择题。除此之外,一副图片内不仅可以包括多个相同类型的题目,还可以包括不同类型的题目,判断方法与上述方法类似,在此不做赘述。
S4,基于所述题目的类型信息分别在第一优先级的所述数据库和第一优先级的所述搜索引擎中对所述题目进行搜索,并将所述数据库中的搜索结果A1和所述搜索引擎中的搜索结果B1进行比较,如果数据库搜索结果A1和搜索引擎搜索结果B1一致,则将所述搜索结果A1或者B1通过所述移动终端反馈给所述用户,并将所述搜索结果展示在所述光标所在位置;如果数据库搜索结果A1和搜索引擎搜索结果B1不一致,则进入步骤S5;继续上面的实施方式,假如上述判断题1的所述数据库中的搜索结果A1为“对”,所述搜索引擎中的搜索结果B1为“对”,则将所述搜索结果“对”通过所述移动终端反馈给所述用户;此外,对于填空题或者问答题,由于搜索结果的答案可能不唯一,此时,对这类题目要建立容错机制,以避免判断错误,例如,可以为用户提取关键词以展示搜索结果。此外,数据库的搜索采用与搜索引擎不同的搜索机制,即,对数据库进行按照题目类型进行分割,每一个题目类型对应一个子数据库,当判断搜索的题目类型为判断题时,仅在判断题对应的子数据库中进行搜索操作,由此可以提高搜索的效率;而对于搜索引擎,由于其搜索能力更加智能化,此时搜索可以更加灵活,可以采用题目类型和题目相结合的搜索方式在搜索引擎中进行搜索,从而提高搜索的效率,避免数据冗余造成的对搜索结果的干扰。
S5,基于所述题目的类型信息分别在第二优先级的所述数据库和第二优先级的所述搜索引擎中对所述题目进行搜索,得到所述数据库中的搜索结果A2和所述搜索引擎中的搜索结果B2,将所述搜索结果A1、B1、A1、B2进行比较,如果出现次数最多的所述搜索结果仅有一个,则将出现次数最多的所述搜索结果提供给所述用户,并将所述搜索结果展示在所述光标所在位置;如果出现次数最多的所述搜索结果有多个,则向所述用户反馈错误信息,并将出现次数最多的多个所述搜索结果提供给所述用户。需要说明的是,继续上面的实施方式,假如上述判断题1的所述数据库中的搜索结果A1为“对”,所述搜索引擎中的搜索结果B1为“错”,由于第一优先级的搜索结果不一致,此时无法判断搜索结果的正确性,则在第二优先级的所述数据库和第二优先级的所述搜索引擎中对所述题目进行搜索,进而对4个搜索结果进行比较,如果出现次数最多的所述搜索结果仅有一个,例如为“错”,则将出现次数最多的所述搜索结果“错”提供给所述用户;如果出现次数最多的所述搜索结果有多个,例如“错”和“对”各有两个,则判断此时搜索结果为矛盾的,则向所述用户反馈错误信息,并将出现次数最多的多个所述搜索结果提供给所述用户。
作为一种优选的实施方式,所述用户通过移动终端设置题目搜索的数据库和搜索引擎及其优先级关系,具体包括:
根据所述用户的历史设置信息或者服务器侧的排名信息通过移动终端为所述用户推荐设置题目搜索的多个数据库及其优先级关系、多个搜索引擎及其优先级关系;在接收到所述题目搜索的指令后同一优先级的所述数据库和所述搜索引擎同时触发搜索操作;所述数据库包括本地数据库和互联网数据库。需要说明的是,对于数据库的优先级设置方式,在首次设置时为用户展示初始化条件下或者默认情况下的设置顺序,用户可以在此基础上进行调整;在后续设置时为用户默认上次的设置顺序,用户可以在此基础上进行进一步调整;搜索引擎可以采用与上述数据库类似的方法进行优先级的设置,在此不做赘述。由此可以提高用户的设置效率。此外,对于同一个优先级的数据库和搜索引擎同时触发搜索操作可以提高搜索的效率。
作为一种优选的实施方式,所述基于所述光标所在的当前位置判断所述光标是否位于题目所在文本区域,具体包括:
设置题目类型对应的语法模型,每一个所述题目类型对应一种或者多种所述语法模型;
基于所述光标所在的当前位置获取所述光标所在段落的文本信息,基于所述文本信息判断所述文本是否属于所述语法模型中的一种,如果所述文本属于所述语法模型中的一种,则所述光标位于所述题目所在文本区域;如果所述文本不属于所述语法模型中的一种,则所述光标不在所述题目所在文本区域。需要说明的是,示例性的,对于题目类型简答题,其可以对应多种语法模型,即由于简答题的句子通常都是完整的疑问语句,因此,六种句型中的疑问句型可以作为其语法模型。
作为一种优选的实施方式,所述题目的类型包括以下任意一种或者几种:填空题、判断题、选择题、问答题;所述分割区域的图像的数量作为所述题目的数量。
作为一种优选的实施方式,所述获取所述题目所在的文本区域的文本,基于所述文本自动判断所述题目的类型和所述题目的内容,具体包括:
S31,设置题目类型对应的题目模型,每一个所述题目模型对应一种或者多种所述语法模型;示例性的,当所述题目为判断题时,所述题目模型可以为:六种句型中的一种,在语句后或者下一段有“对”、“错”或者“√”、“×”的标记。
S32,获取所述光标所在段落的文本信息,判断所述文本信息是否符合所述题目模型,如果符合,则进入步骤S33;如果不符合,判断所述文本信息是否属于所述语法模型,如果属于,则进入步骤S33;如果不属于,则进入步骤S34;需要说明的是,这里可以先对所述题目判断题目模型,再判断语法模型;也可以是先对所述题目判断语法模型,再判断题目模型;在此不做限制。通过上述双重判断,可以提高题目识别的准确性和智能化程度,进而避免了用户手动反复操作的麻烦,改善了用户体验。
S33,根据所述题目的类型在对应优先级的所述数据库的所述题目的类型的子数据库中进行搜索;将所述题目的类型转换为文字信息,基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索;需要说明的是,在搜索引擎内对题目进行搜索时,可以对题目进行关键词提取操作,以提高搜索效率。
S34,判断所述段落的段首和短尾的回车符所在位置,基于所述回车符获取所述段落的前一段和后一段的文本信息,基于所述前一段、所述段落、所述后一段的文本信息判断所述文本信息是否符合所述题目模型,如果符合,则返回步骤S33;如果不符合,判断所述文本信息是否属于所述语法模型,如果属于,则返回步骤S33;如果不属于,则为所述用户提示错误信息。需要说明的是,该步骤是为了保证一个题目的所有文本信息本识别,从而提高题目识别的准确性;即从单段识别扩展到多段识别,同时将多段文本信息结合题目模型和语法模型来判断题目的完整性;此外,本步骤不局限于一次段落扩展,可以根据实际需要向前、向后多次扩展段落,以提高单个题目识别的完整性。
作为一种优选的实施方式,所述获取所述题目所在的文本区域的文本,基于所述文本自动判断所述题目的类型和所述题目的内容,具体包括:
获取所述题目所在的文本区域的文本,基于所述文本向上和/或向下识别相邻区域的文本,基于所述相邻区域的文本判断所述题目的数量,如果所述题目的数量有多个,则基于所述相邻区域的文本自动拆分出每一个所述题目所在的文本区域,并根据所述文本区域的文本判断每一个对应所述题目的类型;对每一个所述题目按照流水线的方式根据所述题目的类型在对应优先级的所述数据库的所述题目的类型的子数据库中进行搜索;将每一个所述题目的类型转换为文字信息,对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索。需要说明的是,本实施例的向前、向后多次扩展段落不仅实现了单个题目完整性的识别,同时实现了上下相邻的多个题目的识别,进一步提高了题目识别的效率;此外,该相邻的多个题目中的每一个题目具体的识别方式参考前述单个题目的识别方法,在此不做赘述。
作为一种优选的实施方式,所述对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索,还包括:
对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索,将所述搜索结果保存在缓存中,当所述用户将所述光标移到到所述题目所在的文本区域后,将所述题目对应的搜索结果展示在所述光标的附近。需要说明的是,当所述题目有多个时,对多个题目按顺序依次自动搜索。上述流水线的题目搜索方式示例性的为:对于题目M1-M3,第一优先级的数据库和搜索引擎先对题目M1进行搜索,如果搜索结果一致,则直接退出搜索流水线,如果搜索结果不一致,则进入第二优先级的数据库和搜索引擎先对题目M1进行搜索,此时,第一优先级的数据库和搜索引擎先对题目M2进行搜索,以此类推。
作为一种优选的实施方式,为不同所述题目类型和/或不同所述题目设置不同的搜索结果展示方式,所述搜索结果展示方式包括颜色、字体、大小中的一种或者几种。
作为一种优选的实施方式,将出现次数最多的所述搜索结果提供给所述用户,或者,将出现次数最多的多个所述搜索结果提供给所述用户,具体包括:
检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签;如果没有所述控件标签,则将所述搜索结果提供给所述用户。需要说明的是,示例性的,所述控件标签可以为选择题中的A/B/C/D等选项对应的button按钮控件,也可以为判断题中对、错对应的button按钮控件;通常具有上述控件的题目类型为客观题;对于没有上述类型控件的题目,通常为主观题,此时,则仅仅提供搜索结果,而不做下一步处理的操作。
作为一种优选的实施方式,所述检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签,还包括:
检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签;
检测所述题目所在文本区域是否有所述搜索结果对应的所述控件标签以外的所述交互式控件标签,如果有所述控件标签,则根据所述控件标签的属性信息判断所述控件标签的类型,基于所述控件标签的类型使能当前页面前进的所述控件标签。需要说明的是,示例性的,所述搜索结果对应的所述控件标签以外的所述交互式控件标签可以为上一题、下一题、退出、跳过等button按钮控件;通过获取上述控件标签的属性信息,可以获取其对当前题目的下一步操作,优选的,本发明执行前进操作,例如,下一题、跳过等进入下一步题目的操作;由此可以提高题目识别的效果,避免了用户频繁的操作,从而改善了用户体验。
本发明提供一种基于互联网的教育信息快速获取方法,所述方法设置多个题目搜索的数据库和搜索引擎及其优先级关系,有效整合了各个数据资源,提高了搜索结果的准确性,提高了搜索效率;基于光标所在位置解析出题目类型,从而提高了搜索的针对性和搜索效率;对当前页面的文本进行分析进而获取多个题目,可以在一个页面上搜索多个题目,从而提高了搜索的效率;此外,设置了搜索的数据库和搜索引擎的优先级,可以提高搜索的个性化和搜索的灵活性,满足不同用户的不同搜索需求;最后,根据页面控件自动触发题目解析的后续动作,提高了题目解析的效率。
实施例二:
本发明提供一种基于互联网的教育信息快速获取装置,所述装置执行上述互联网的教育信息快速获取方法任意实施例所述的方法的步骤,所述装置可以与所述方法建立一一对应的关系。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来生成机器,从而通过计算机或其他可编程数据处理方法的处理器来执行的指令创建了用于实现结构图和/或框图和/或流图的框或多个框中指定的方法。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于互联网的教育信息快速获取方法,其特征在于,所述方法包括如下步骤:
S1,用户通过移动终端设置题目搜索的数据库和搜索引擎及其优先级关系;所述数据库和所述搜索引擎分别有一个或者多个;
S2,所述移动终端接收所述用户是否进入题目搜索模式,如果进入题目搜索模式,则检测所述题目搜索模式下当前光标所在位置,如果所述光标在文本区域,则进入步骤S3,如果所述光标不在文本区域,则提示所述用户移动所述光标到文本区域;如果未进入题目搜索模式,则不做任何处理;
S3,基于所述光标所在的当前位置判断所述光标是否位于题目所在文本区域,如果是,则获取所述题目所在的文本区域的文本,并基于所述文本自动判断所述题目的类型和所述题目的内容,并将所述题目的类型信息标记到对应的所述题目的内容;
S4,基于所述题目的类型信息分别在第一优先级的所述数据库和第一优先级的所述搜索引擎中对所述题目进行搜索,并将所述数据库中的搜索结果A1和所述搜索引擎中的搜索结果B1进行比较,如果数据库搜索结果A1和搜索引擎搜索结果B1一致,则将所述搜索结果A1或者B1通过所述移动终端反馈给所述用户,并将所述搜索结果展示在所述光标所在位置;如果数据库搜索结果A1和搜索引擎搜索结果B1不一致,则进入步骤S5;
S5,基于所述题目的类型信息分别在第二优先级的所述数据库和第二优先级的所述搜索引擎中对所述题目进行搜索,得到所述数据库中的搜索结果A2和所述搜索引擎中的搜索结果B2,将所述搜索结果A1、B1、A1、B2进行比较,如果出现次数最多的所述搜索结果仅有一个,则将出现次数最多的所述搜索结果提供给所述用户,并将所述搜索结果展示在所述光标所在位置;如果出现次数最多的所述搜索结果有多个,则向所述用户反馈错误信息,并将出现次数最多的多个所述搜索结果提供给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述用户通过移动终端设置题目搜索的数据库和搜索引擎及其优先级关系,具体包括:
根据所述用户的历史设置信息或者服务器侧的排名信息通过移动终端为所述用户推荐设置题目搜索的多个数据库及其优先级关系、多个搜索引擎及其优先级关系;在接收到所述题目搜索的指令后同一优先级的所述数据库和所述搜索引擎同时触发搜索操作;所述数据库包括本地数据库和互联网数据库。
3.根据权利要求1所述的方法,其特征在于,所述基于所述光标所在的当前位置判断所述光标是否位于题目所在文本区域,具体包括:
设置题目类型对应的语法模型,每一个所述题目类型对应一种或者多种所述语法模型;
基于所述光标所在的当前位置获取所述光标所在段落的文本信息,基于所述文本信息判断所述文本是否属于所述语法模型中的一种,如果所述文本属于所述语法模型中的一种,则所述光标位于所述题目所在文本区域;如果所述文本不属于所述语法模型中的一种,则所述光标不在所述题目所在文本区域。
4.根据权利要求3所述的方法,其特征在于,所述题目的类型包括以下任意一种或者几种:填空题、判断题、选择题、问答题;所述分割区域的图像的数量作为所述题目的数量。
5.根据权利要求3所述的方法,其特征在于,所述获取所述题目所在的文本区域的文本,基于所述文本自动判断所述题目的类型和所述题目的内容,具体包括:
S31,设置题目类型对应的题目模型,每一个所述题目模型对应一种或者多种所述语法模型;
S32,获取所述光标所在段落的文本信息,判断所述文本信息是否符合所述题目模型,如果符合,则进入步骤S33;如果不符合,判断所述文本信息是否属于所述语法模型,如果属于,则进入步骤S33;如果不属于,则进入步骤S34;
S33,根据所述题目的类型在对应优先级的所述数据库的所述题目的类型的子数据库中进行搜索;将所述题目的类型转换为文字信息,基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索;
S34,判断所述段落的段首和短尾的回车符所在位置,基于所述回车符获取所述段落的前一段和后一段的文本信息,基于所述前一段、所述段落、所述后一段的文本信息判断所述文本信息是否符合所述题目模型,如果符合,则返回步骤S33;如果不符合,判断所述文本信息是否属于所述语法模型,如果属于,则返回步骤S33;如果不属于,则为所述用户提示错误信息。
6.根据权利要求3所述的方法,其特征在于,所述获取所述题目所在的文本区域的文本,基于所述文本自动判断所述题目的类型和所述题目的内容,具体包括:
获取所述题目所在的文本区域的文本,基于所述文本向上和/或向下识别相邻区域的文本,基于所述相邻区域的文本判断所述题目的数量,如果所述题目的数量有多个,则基于所述相邻区域的文本自动拆分出每一个所述题目所在的文本区域,并根据所述文本区域的文本判断每一个对应所述题目的类型;对每一个所述题目按照流水线的方式根据所述题目的类型在对应优先级的所述数据库的所述题目的类型的子数据库中进行搜索;将每一个所述题目的类型转换为文字信息,对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索。
7.根据权利要求6所述的方法,其特征在于,所述对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索,还包括:
对每一个所述题目按照流水线的方式基于所述题目的文字信息和所述题目的类型的文字信息在对应优先级的所述搜索引擎的搜索端口进行搜索,将所述搜索结果保存在缓存中,当所述用户将所述光标移到到所述题目所在的文本区域后,将所述题目对应的搜索结果展示在所述光标的附近。
8.根据权利要求7所述的方法,其特征在于,还包括:
为不同所述题目类型和/或不同所述题目设置不同的搜索结果展示方式,所述搜索结果展示方式包括颜色、字体、大小中的一种或者几种。
9.根据权利要求1所述的方法,其特征在于,将出现次数最多的所述搜索结果提供给所述用户,或者,将出现次数最多的多个所述搜索结果提供给所述用户,具体包括:
检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签;如果没有所述控件标签,则将所述搜索结果提供给所述用户。
10.根据权利要求9所述的方法,其特征在于,所述检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签,还包括:
检测所述题目所在文本区域是否有交互式控件标签,如果有所述控件标签,则直接根据所述搜索结果使能对应的所述控件标签;
检测所述题目所在文本区域是否有所述搜索结果对应的所述控件标签以外的所述交互式控件标签,如果有所述控件标签,则根据所述控件标签的属性信息判断所述控件标签的类型,基于所述控件标签的类型使能当前页面前进的所述控件标签。
CN201810082771.8A 2018-01-29 2018-01-29 一种基于互联网的教育信息快速获取方法 Active CN108153915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810082771.8A CN108153915B (zh) 2018-01-29 2018-01-29 一种基于互联网的教育信息快速获取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810082771.8A CN108153915B (zh) 2018-01-29 2018-01-29 一种基于互联网的教育信息快速获取方法

Publications (2)

Publication Number Publication Date
CN108153915A true CN108153915A (zh) 2018-06-12
CN108153915B CN108153915B (zh) 2020-06-23

Family

ID=62459069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810082771.8A Active CN108153915B (zh) 2018-01-29 2018-01-29 一种基于互联网的教育信息快速获取方法

Country Status (1)

Country Link
CN (1) CN108153915B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319703A (zh) * 2018-02-05 2018-07-24 赵宇航 一种基于互联网的教育信息快速获取装置
CN110531915A (zh) * 2019-08-30 2019-12-03 维沃移动通信有限公司 屏幕操作方法及终端设备
CN111666474A (zh) * 2019-03-08 2020-09-15 小船出海教育科技(北京)有限公司 一种整页搜题的方法及终端
CN111723308A (zh) * 2020-06-22 2020-09-29 北京环球优路教育科技股份有限公司 一种基于互联网的教育信息搜索系统
CN114610845A (zh) * 2022-03-02 2022-06-10 北京百度网讯科技有限公司 基于多系统的智能问答方法、装置和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775666B1 (en) * 2001-05-29 2004-08-10 Microsoft Corporation Method and system for searching index databases
CN101110077A (zh) * 2007-08-24 2008-01-23 新诺亚舟科技(深圳)有限公司 在手持学习终端上实现的联合搜索的方法
CN101510197A (zh) * 2008-02-15 2009-08-19 冲电气工业株式会社 信息检索系统
US20100057644A1 (en) * 2008-09-03 2010-03-04 International Business Machines Corporation Interactive digital video library
CN102231152A (zh) * 2011-05-25 2011-11-02 北京捷讯华泰科技有限公司 基于移动终端ip地址进行精确查询的搜索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775666B1 (en) * 2001-05-29 2004-08-10 Microsoft Corporation Method and system for searching index databases
CN101110077A (zh) * 2007-08-24 2008-01-23 新诺亚舟科技(深圳)有限公司 在手持学习终端上实现的联合搜索的方法
CN101510197A (zh) * 2008-02-15 2009-08-19 冲电气工业株式会社 信息检索系统
US20100057644A1 (en) * 2008-09-03 2010-03-04 International Business Machines Corporation Interactive digital video library
CN102231152A (zh) * 2011-05-25 2011-11-02 北京捷讯华泰科技有限公司 基于移动终端ip地址进行精确查询的搜索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周思繁: "浅谈网络信息检索方法及技巧", 《科技文献信息管理》 *
唐莉萍: "基于多元化考核模式的文献检索课程改革与实践", 《卫生职业教育》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319703A (zh) * 2018-02-05 2018-07-24 赵宇航 一种基于互联网的教育信息快速获取装置
CN111666474A (zh) * 2019-03-08 2020-09-15 小船出海教育科技(北京)有限公司 一种整页搜题的方法及终端
CN111666474B (zh) * 2019-03-08 2023-08-25 北京百舸飞驰科技有限公司 一种整页搜题的方法及终端
CN110531915A (zh) * 2019-08-30 2019-12-03 维沃移动通信有限公司 屏幕操作方法及终端设备
CN111723308A (zh) * 2020-06-22 2020-09-29 北京环球优路教育科技股份有限公司 一种基于互联网的教育信息搜索系统
CN114610845A (zh) * 2022-03-02 2022-06-10 北京百度网讯科技有限公司 基于多系统的智能问答方法、装置和设备
CN114610845B (zh) * 2022-03-02 2024-05-14 北京百度网讯科技有限公司 基于多系统的智能问答方法、装置和设备

Also Published As

Publication number Publication date
CN108153915B (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
CN108153915A (zh) 一种基于互联网的教育信息快速获取方法
CN108052687A (zh) 一种基于互联网的教育信息搜索系统
CN109242736A (zh) 一种协助老师了解学生的学习情况的方法和系统
CN107729445B (zh) 一种基于html5的大文本阅读定位及显示方法
WO2022111244A1 (zh) 数据处理方法、装置、电子设备及存储介质
CN106781784A (zh) 一种智能批改系统
CN109513211B (zh) 美术资源文件的处理方法、装置以及游戏资源展示系统
MXPA05000237A (es) Sistema y metodo de anotacion automatica de ensayo.
CN110377743B (zh) 一种文本标注方法及装置
US20190272769A1 (en) Information processing device, information processing method, and non-transitory computer readable medium storing information processing program
US20160140389A1 (en) Information extraction supporting apparatus and method
US20160117301A1 (en) Annotation sharing system and method
CN111090809A (zh) 题目推荐方法、装置、计算机设备和存储介质
CN108319703A (zh) 一种基于互联网的教育信息快速获取装置
CN113886567A (zh) 一种基于知识图谱的教学方法及系统
CN105930486A (zh) 大数据的快速搜索方法及装置
CN112231522A (zh) 一种在线课程知识树的生成关联方法
CN104881428A (zh) 一种信息图网页的信息图提取、检索方法和装置
CN108182284A (zh) 一种基于互联网的教育信息处理方法及装置
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN106650720A (zh) 基于文字识别技术的网上评卷方法、装置及系统
CN112907155A (zh) 评价学生作业产品的方法
CN113505787A (zh) 题目批改方法及系统、采用的电子设备及计算机可读介质
CN110032561B (zh) 基于语义的表单构建方法和系统
CN111475699B (zh) 网站数据爬取方法和装置、电子设备、及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200513

Address after: 610000 No.6, unit 2, building 1, No.57, community main street, Xinglong Street, Tianfu New District, Chengdu, Sichuan Province

Applicant after: Chengdu hi xueluozi Education Technology Co., Ltd

Address before: 410000 No. 408 west slope, Yuelu District, Hunan, Changsha, Tongzi

Applicant before: Zhao Yuhang

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220315

Address after: 100107 Room 501, 5 / F, 101, building 2, yard 36, Hongjunying South Road, Chaoyang District, Beijing

Patentee after: Beijing shupeitong Network Technology Co.,Ltd.

Address before: 610000 No. 6, unit 2, building 1, No. 57, community main street, Chang town, Xinglong Street, Tianfu new area, Chengdu, Sichuan

Patentee before: Chengdu hi xueluozi Education Technology Co.,Ltd.

TR01 Transfer of patent right