CN109766415B - 一种书本目录的定位方法及系统 - Google Patents

一种书本目录的定位方法及系统 Download PDF

Info

Publication number
CN109766415B
CN109766415B CN201910047101.7A CN201910047101A CN109766415B CN 109766415 B CN109766415 B CN 109766415B CN 201910047101 A CN201910047101 A CN 201910047101A CN 109766415 B CN109766415 B CN 109766415B
Authority
CN
China
Prior art keywords
keyword
name
target
book
directory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910047101.7A
Other languages
English (en)
Other versions
CN109766415A (zh
Inventor
魏誉荧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201910047101.7A priority Critical patent/CN109766415B/zh
Publication of CN109766415A publication Critical patent/CN109766415A/zh
Application granted granted Critical
Publication of CN109766415B publication Critical patent/CN109766415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于教育产品技术领域,公开了一种书本目录的定位方法及系统,其方法包括:获取大量用户学习时产生的语料信息;根据所述语料信息构建关键词库;将所述关键词库中的关键词与书本目录的名称对应;获取当前用户的输入信息,并提取出所述输入信息中的实体;根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。本发明可根据用户输入的信息在书本目录中直接定位到用户需要查找的知识点,无需用户手动进行查找,不仅可节省用户的查找时间,而且可提高用户的使用体验。

Description

一种书本目录的定位方法及系统
技术领域
本发明属于教育产品技术领域,特别涉及一种书本目录的定位方法及系统。
背景技术
随着智能终端及网络技术的迅速发展,使用智能移动终端进行移动学习的方式也逐渐被人们所重视,而且移动学习作为一种新的学习方式将成为现代社会的一种重要的学习方式与手段。
目前,为了方便用户进行移动学习,智能学习设备中收录了大量不同种类的学习内容,其中包括不同年级的书本;而随着书本种类和数量的增长,当用户需要查找书本中的某个知识点时,往往需要花费大量的时间和精力在每个书本的目录中进行查找,无法对书本目录中的知识点进行定位,不仅浪费了用户的时间,而且降低了用户的使用体验。
发明内容
本发明的目的是提供一种书本目录的定位方法,实现根据用户输入的信息定位书本目录,以节省用户的查找时间,提高用户的使用体验。
本发明提供的技术方案如下:
一方面,提供一种书本目录的定位方法,包括:
获取大量用户学习时产生的语料信息;
根据所述语料信息构建关键词库;
将所述关键词库中的关键词与书本目录的名称对应;
获取当前用户的输入信息,并提取出所述输入信息中的实体;
根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
进一步优选地,所述根据所述语料信息构建关键词库具体包括:
对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
提取每个语义槽的关键词,构建关键词库。
进一步优选地,所述根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录具体包括:
在所述语义槽中查找与所述输入信息中的实体匹配的语义槽作为目标语义槽;
获取所述目标语义槽的关键词作为目标关键词;
根据所述关键词库中的关键词与书本目录的名称的对应关系,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
根据所述目标名称定位所述书本目录。
进一步优选地,所述根据所述语料信息构建关键词库之后,所述将所述关键词库中的关键词与书本目录的名称对应之前还包括:
建立所述关键词库中的关键词之间的关联关系;
所述根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录具体包括:
根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
进一步优选地,所述根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录具体包括:
在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
根据所述目标名称定位所述书本目录。
另一方面,还提供一种书本目录的定位系统,包括:
语料信息获取模块,用于获取大量用户学习时产生的语料信息;
关键词库构建模块,用于根据所述语料信息构建关键词库;
对应关系建立模块,用于将所述关键词库中的关键词与书本目录的名称对应;
实体提取模块,用于获取当前用户的输入信息,并提取出所述输入信息中的实体;
目录定位模块,用于根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
进一步优选地,所述关键词库构建模块包括:
语义槽形成单元,用于对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
关键词库构建单元,用于提取每个语义槽的关键词,构建关键词库。
进一步优选地,所述目录定位模块包括:
目标语义槽查找单元,用于在所述语义槽中查找与所述输入信息中的实体匹配的语义槽作为目标语义槽;
目标关键词获取单元,用于获取所述目标语义槽的关键词作为目标关键词;
目标名称查找单元,用于根据所述关键词库中的关键词与书本目录的名称的对应关系,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
目录定位单元,用于根据所述目标名称定位所述书本目录。
进一步优选地,还包括:
关联关系建立模块,用于建立所述关键词库中的关键词之间的关联关系;
所述目录定位模块包括:
目录定位单元,用于根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
进一步优选地,所述目录定位单元包括:
目标关键词查找子单元,用于在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
判断子单元,用于根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
目标名称查找子单元,用于当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
所述目标名称查找子单元,还用于当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
定位子单元,用于根据所述目标名称定位所述书本目录。
与现有技术相比,本发明提供的一种书本目录的定位方法及系统具有以下有益效果:
1、本发明先获取大量的语料信息,然后根据语料信息形成关键词库,并建立关键词库中的关键词与书本目录中的名称的对应关系,当获取到当前用户输入的输入信息后,即可根据输入信息中的关键词、以及关键词库中的关键词与书本目录中的名称的对应关系定位书本目录,即学习设备可根据用户输入的信息在书本目录中直接定位到用户需要查找的知识点,无需用户手动进行查找,不仅可节省用户的查找时间,而且可提高用户的使用体验。
2、在本发明一优选实施例中,将语义相同的实体组合成一个语义槽,使语义槽中尽可能多地包含说法不同但语义相同的实体,当从输入信息中提取出实体后,增加实体匹配的概率。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种书本目录的定位方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种书本目录的定位方法的第一实施例的流程示意图;
图2是本发明一种书本目录的定位方法的第二实施例的流程示意图;
图3是本发明一种书本目录的定位方法的第三实施例的流程示意图;
图4是本发明一种书本目录的定位方法的第四实施例的流程示意图;
图5是本发明一种书本目录的定位方法的第五实施例的流程示意图;
图6是本发明一种书本目录的定位方法的第六实施例的流程示意图;
图7是本发明一种书本目录的定位方法的第七实施例的流程示意图;
图8是本发明一种书本目录的定位系统的实施例的结构示意框图。
附图标号说明
100、语料信息获取模块; 200、关键词库构建模块;
210、语义槽形成单元; 220、关键词库构建单元;
300、对应关系建立模块; 400、实体提取模块;
500、目录定位模块; 510、目标语义槽查找单元;
520、目标关键词获取单元; 530、目标名称查找单元;
540、目录定位单元; 541、目标关键词查找子单元;
542、判断子单元; 543、目标名称查找子单元;
544、定位子单元; 600、关联关系建立模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
根据本发明提供的第一实施例,如图1所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S200根据所述语料信息构建关键词库;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S500根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
具体地,智能学习设备如家教机等收集海量用户在智能学习设备上学习时产生的语料信息,示例性地,语料信息为“学习一元一次方程”、“方程式中的几元和几次是什么意思”、“分数的概念”等。
得到海量语料信息后,对海量语料信息进行处理,提取出每条语料信息中与知识点相关的关键词,例如,一条语料信息为“学习一元一次方程”,提取出的关键词为“一元一次方程”;另一条语料信息为“分数的概念”,提取出的关键词为“分数”。提取出所有语料信息中的关键词后,根据提取出的关键词形成关键词库。
形成关键词库后,建立关键词库中的关键词与书本目录的名称的对应关系,如关键词为“一元一次方程”,则将关键词“一元一次方程”与书本目录中的名称“一元一次方程”对应,如关键词为“分数”,则将关键词“分数”与书本目录中的名称“分数”对应。
当获取到当前用户输入的信息后,先提取出输入信息中与知识点相关的实体,如输入信息为“一元一次方程的概念”,则提取出的实体为“一元一次方程”。在输入信息中提取与知识点相关的实体时,可先对输入信息进行分词,得到分词后的多个实体,然后对分词后的多个实体进行语义解析,提取出与知识点相关的实体。
在输入信息中提取出实体后,可在关键词库中查找与提取出的实体相匹配的关键词作为目标关键词,然后根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。例如,提取出的实体为“一元一次方程”,在关键词库中查找到代表“一元一次方程”的关键词,然后根据该关键词与书本目录的名称的对应关系,在书本目录中定位到名称为“一元一次方程”的地方,使得当前用户根据定位到的地方所标记的页码快速地查找到书本中有关“一元一次方程”的章节,以方便用户进行学习。
本发明先获取大量的语料信息,然后根据语料信息形成关键词库,并建立关键词库中的关键词与书本目录中的名称的对应关系,当获取到当前用户输入的输入信息后,即可根据输入信息中的关键词、以及关键词库中的关键词与书本目录中的名称的对应关系定位书本目录,即学习设备可根据用户输入的信息在书本目录中直接定位到用户需要查找的知识点,无需用户手动进行查找,不仅可节省用户的查找时间,而且可提高用户的使用体验。
根据本发明提供的第二实施例,如图2所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S210对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
S220提取每个语义槽的关键词,构建关键词库;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S500根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
具体地,智能学习设备获取到海量语料信息后,先对每条语料信息进行分词处理,提取出每条语料信息中的实体,得到海量实体,对得到的实体进行语义解析,根据语义解析结果,将语义相同的实体归为一个语义槽,对海量语料信息进行处理即可得到多个语义槽。例如,一个实体为“方程”,另一个实体为“方程式”,则这两个实体属于语义相同的实体,应将“方程”和“方程式”这两个实体归为一个语义槽,即每个语义槽中存储的是语义相同的一个或多个实体。
得到多个语义槽后,提取出每个语义槽的关键词,该关键词为语义槽中的实体的共有语义,如语义槽中包括“方程”和“方程式”两个实体,则提取出的关键词为“方程”。提取出每个语义槽的关键词后,由提取出的关键词形成关键词库。根据关键词的语义建立关键词库中的关键词与书本目录的名称之间的对应关系。
根据本发明提供的第三实施例,如图3所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S210对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
S220提取每个语义槽的关键词,构建关键词库;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S510在所述语义槽中查找与所述输入信息中的实体匹配的语义槽作为目标语义槽;
S520获取所述目标语义槽的关键词作为目标关键词;
S530根据所述关键词库中的关键词与书本目录的名称的对应关系,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
S540根据所述目标名称定位所述书本目录。
具体地,对获取的海量语料信息进行处理,提取出语料信息中的实体后,将语义相同的实体归为一个语义槽,得到多个语义槽,然后提取出每个语义槽的关键词后,建立关键词与书本目录的名称之间的对应关系。当获取到当前用户的输入信息,并提取出输入信息中的实体后,在之前形成的多个语义槽中查找与输入信息中的实体匹配的语义槽作为目标语义槽。例如,语义槽1包括“实体1”、“实体2”、“实体3”;语义槽2包括“实体4”、“实体5”、“实体6”;若从输入信息中提取出的实体为“实体1”,由于“实体1”在语义槽1中,则与输入信息中的实体匹配的语义槽为语义槽1,即将语义槽1作为目标语义槽。
得到目标语义槽后,根据目标语义槽的关键词与书本目录的名称的对应关系,在书本目录中查找与目标语义槽的关键词对应的名称作为目标名称,然后根据目标名称定位书本目录。
本实施例中,将语义相同的实体组合成一个语义槽(集合),使语义槽中尽可能多地包含说法不同但语义相同的实体,当从输入信息中提取出实体后,增加实体匹配的概率。
根据本发明提供的第四实施例,如图4所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S200根据所述语料信息构建关键词库;
S250建立所述关键词库中的关键词之间的关联关系;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S550根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
具体地,根据实施例一中的方法建立关键词库后,分析关键词库中的关键词之间的关联关系,如并列关系、包含关系等。例如,从语料信息“学习方程中的一元一次方程”中提取出的关键词为“方程”和“一元一次方程”,“方程”与“一元一次方程”之间的关系为包含关系,即“方程”包含“一元一次方程”。再例如,从语料信息“几何图形中的线段和射线的区别”中提取出的关键词为“几何图形”、“线段”和“射线”,“几何图形”与“线段”是包含关系,“几何图形”与“射线”也是包含关系,“线段”与“射线”是并列关系。
得到关键词库中的关键词之间的关联关系后,当从输入信息中提取出实体,假设关键词库中的关键词与书本目录的名称一一对应,则可在关键词库中查找与提取出的实体相匹配的关键词作为目标关键词,然后根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当从输入信息中提取出的实体为一个时,直接根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当从输入信息中提取出的实体为多个时,在关键词库中查找到的目标关键词也为多个,根据关键词库中的关键词之间的关联关系,确定多个目标关键词之间的关联关系。若这多个目标关键词之间的关系为包含关系,则根据最低级别的目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的地方。若这多个目标关键词之间的关系为并列关系,则分别根据这多个目标关键词与书本目录的名称的对应关系在书本目录中定位到多个不同的地方。
示例性地,若目标关键词为“射线”和“线段”,则在书本目录中分别定位到名称为“射线”的地方以及名称为“线段”的地方;若目标关键词为“几何图形”和“线段”,则根据最低级别的目标关键词“线段”与书本目录的名称的对应关系在书本目录中定位到名称为“线段”的地方。
根据本发明提供的第五实施例,如图5所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S200根据所述语料信息构建关键词库;
S250建立所述关键词库中的关键词之间的关联关系;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S560在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
S565根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
S570当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
S575当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
S580根据所述目标名称定位所述书本目录。
具体地,根据实施例四中的方法得到关键词库中的关键词之间的关联关系后,并从输入信息中提取出实体后,假设关键词库中的关键词与书本目录的名称不是一一对应,即关键词库中存在关键词与书本目录的名称无对应关系的情况。当在关键词库中查找到与输入信息的实体匹配的目标关键词后,若目标关键词与书本目录的名称对应时,则直接根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当目标关键词与书本目录的名称不对应时,根据关键词库中的关键词之间的关联关系,在关键词库中查找目标关键词的上级关键词和/或下级关键词,然后根据上级关键词和/或下级关键词与书本目录的名称之间的对应关系在书本目录中定位到对应的名称。本实施例根据目标关键词的上级关键词和/或下级关键词在书本目录中定位到对应的名称,可增加定位到对应的名称的概率,提高用户的使用体验。
根据本发明提供的第六实施例,如图6所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S210对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
S220提取每个语义槽的关键词,构建关键词库;
S250建立所述关键词库中的关键词之间的关联关系;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S550根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
具体地,根据实施例四的方法得到关键词库中的关键词之间的关联关系后,并从输入信息中提取出实体后,在根据实施例二的方法形成的多个语义槽中查找与输入信息中的实体匹配的语义槽作为目标语义槽。例如,语义槽1包括“实体1”、“实体2”、“实体3”;语义槽2包括“实体4”、“实体5”、“实体6”;若从输入信息中提取出的实体为“实体1”,由于“实体1”在语义槽1中,则与输入信息中的实体匹配的语义槽为语义槽1,即将语义槽1作为目标语义槽。
得到目标语义槽后,根据目标语义槽对应的关键词与书本目录的名称的对应关系,在书本目录中查找与目标语义槽的关键词对应的名称作为目标名称,然后根据目标名称定位书本目录。
假设关键词库中的关键词与书本目录的名称一一对应,当从输入信息中提取出的实体为一个时,直接根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当从输入信息中提取出的实体为多个时,在关键词库中查找到的目标关键词也为多个,根据关键词库中的关键词之间的关联关系,确定多个目标关键词之间的关联关系。若这多个目标关键词之间的关系为包含关系,则根据最低级别的目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的地方。若这多个目标关键词之间的关系为并列关系,则分别根据这多个目标关键词与书本目录的名称的对应关系在书本目录中定位到多个不同的地方。
根据本发明提供的第七实施例,如图7所示,一种书本目录的定位方法,包括:
S100获取大量用户学习时产生的语料信息;
S210对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
S220提取每个语义槽的关键词,构建关键词库;
S250建立所述关键词库中的关键词之间的关联关系;
S300将所述关键词库中的关键词与书本目录的名称对应;
S400获取当前用户的输入信息,并提取出所述输入信息中的实体;
S560在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
S565根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
S570当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
S575当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
S580根据所述目标名称定位所述书本目录。
本实施例中的各个步骤的具体描述已经在上述对应的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本发明提供的第八实施例,如图8所示,一种书本目录的定位系统,包括:
语料信息获取模块100,用于获取大量用户学习时产生的语料信息;
关键词库构建模块200,用于根据所述语料信息构建关键词库;
对应关系建立模块300,用于将所述关键词库中的关键词与书本目录的名称对应;
实体提取模块400,用于获取当前用户的输入信息,并提取出所述输入信息中的实体;
目录定位模块500,用于根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
具体地,智能学习设备如家教机等收集海量用户在智能学习设备上学习时产生的语料信息,示例性地,语料信息为“学习一元一次方程”、“方程式中的几元和几次是什么意思”、“分数的概念”等。
得到海量语料信息后,对海量语料信息进行处理,提取出每条语料信息中与知识点相关的关键词,例如,一条语料信息为“学习一元一次方程”,提取出的关键词为“一元一次方程”;另一条语料信息为“分数的概念”,提取出的关键词为“分数”。提取出所有语料信息中的关键词后,根据提取出的关键词形成关键词库。
形成关键词库后,建立关键词库中的关键词与书本目录的名称的对应关系,如关键词为“一元一次方程”,则将关键词“一元一次方程”与书本目录中的名称“一元一次方程”对应,如关键词为“分数”,则将关键词“分数”与书本目录中的名称“分数”对应。
当获取到当前用户输入的信息后,先提取出输入信息中与知识点相关的实体,如输入信息为“一元一次方程的概念”,则提取出的实体为“一元一次方程”。在输入信息中提取与知识点相关的实体时,可先对输入信息进行分词,得到分词后的多个实体,然后对分词后的多个实体进行语义解析,提取出与知识点相关的实体。
在输入信息中提取出实体后,可在关键词库中查找与提取出的实体相匹配的关键词作为目标关键词,然后根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。例如,提取出的实体为“一元一次方程”,在关键词库中查找到代表“一元一次方程”的关键词,然后根据该关键词与书本目录的名称的对应关系,在书本目录中定位到名称为“一元一次方程”的地方,使得当前用户根据定位到的地方所标记的页码快速地查找到书本中有关“一元一次方程”的章节,以方便用户进行学习。
本发明先获取大量的语料信息,然后根据语料信息形成关键词库,并建立关键词库中的关键词与书本目录中的名称的对应关系,当获取到当前用户输入的输入信息后,即可根据输入信息中的关键词、以及关键词库中的关键词与书本目录中的名称的对应关系定位书本目录,即学习设备可根据用户输入的信息在书本目录中直接定位到用户需要查找的知识点,无需用户手动进行查找,不仅可节省用户的查找时间,而且可提高用户的使用体验。
优选地,所述关键词库构建模块200包括:
语义槽形成单元210,用于对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
关键词库构建单元220,用于提取每个语义槽的关键词,构建关键词库。
具体地,智能学习设备获取到海量语料信息后,先对每条语料信息进行分词处理,提取出每条语料信息中的实体,得到海量实体,对得到的实体进行语义解析,根据语义解析结果,将语义相同的实体归为一个语义槽,对海量语料信息进行处理即可得到多个语义槽。例如,一个实体为“方程”,另一个实体为“方程式”,则这两个实体属于语义相同的实体,应将“方程”和“方程式”这两个实体归为一个语义槽,即每个语义槽中存储的是语义相同的一个或多个实体。
得到多个语义槽后,提取出每个语义槽的关键词,该关键词为语义槽中的实体的共有语义,如语义槽中包括“方程”和“方程式”两个实体,则提取出的关键词为“方程”。提取出每个语义槽的关键词后,由提取出的关键词形成关键词库。根据关键词的语义建立关键词库中的关键词与书本目录的名称之间的对应关系。
优选地,所述目录定位模块500包括:
目标语义槽查找单元510,用于在所述语义槽中查找与所述输入信息中的实体匹配的语义槽作为目标语义槽;
目标关键词获取单元520,用于获取所述目标语义槽的关键词作为目标关键词;
目标名称查找单元530,用于根据所述关键词库中的关键词与书本目录的名称的对应关系,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
目录定位单元540,用于根据所述目标名称定位所述书本目录。
具体地,对获取的海量语料信息进行处理,提取出语料信息中的实体后,将语义相同的实体归为一个语义槽,得到多个语义槽,然后提取出每个语义槽的关键词后,建立关键词与书本目录的名称之间的对应关系。当获取到当前用户的输入信息,并提取出输入信息中的实体后,在之前形成的多个语义槽中查找与输入信息中的实体匹配的语义槽作为目标语义槽。例如,语义槽1包括“实体1”、“实体2”、“实体3”;语义槽2包括“实体4”、“实体5”、“实体6”;若从输入信息中提取出的实体为“实体1”,由于“实体1”在语义槽1中,则与输入信息中的实体匹配的语义槽为语义槽1,即将语义槽1作为目标语义槽。
得到目标语义槽后,根据目标语义槽的关键词与书本目录的名称的对应关系,在书本目录中查找与目标语义槽的关键词对应的名称作为目标名称,然后根据目标名称定位书本目录。
本实施例中,将语义相同的实体组合成一个语义槽(集合),使语义槽中尽可能多地包含说法不同但语义相同的实体,当从输入信息中提取出实体后,增加实体匹配的概率。
优选地,还包括:
关联关系建立模块600,用于建立所述关键词库中的关键词之间的关联关系;
所述目录定位模块500包括:
目录定位单元540,用于根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
具体地,根据实施例一中的方法建立关键词库后,分析关键词库中的关键词之间的关联关系,如并列关系、包含关系等。例如,从语料信息“学习方程中的一元一次方程”中提取出的关键词为“方程”和“一元一次方程”,“方程”与“一元一次方程”之间的关系为包含关系,即“方程”包含“一元一次方程”。再例如,从语料信息“几何图形中的线段和射线的区别”中提取出的关键词为“几何图形”、“线段”和“射线”,“几何图形”与“线段”是包含关系,“几何图形”与“射线”也是包含关系,“线段”与“射线”是并列关系。
得到关键词库中的关键词之间的关联关系后,当从输入信息中提取出实体,假设关键词库中的关键词与书本目录的名称一一对应,则可在关键词库中查找与提取出的实体相匹配的关键词作为目标关键词,然后根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当从输入信息中提取出的实体为一个时,直接根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当从输入信息中提取出的实体为多个时,在关键词库中查找到的目标关键词也为多个,根据关键词库中的关键词之间的关联关系,确定多个目标关键词之间的关联关系。若这多个目标关键词之间的关系为包含关系,则根据最低级别的目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的地方。若这多个目标关键词之间的关系为并列关系,则分别根据这多个目标关键词与书本目录的名称的对应关系在书本目录中定位到多个不同的地方。
示例性地,若目标关键词为“射线”和“线段”,则在书本目录中分别定位到名称为“射线”的地方以及名称为“线段”的地方;若目标关键词为“几何图形”和“线段”,则根据最低级别的目标关键词“线段”与书本目录的名称的对应关系在书本目录中定位到名称为“线段”的地方。
优选地,所述目录定位单元540包括:
目标关键词查找子单元541,用于在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
判断子单元542,用于根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
目标名称查找子单元543,用于当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
所述目标名称查找子单元543,还用于当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
定位子单元544,用于根据所述目标名称定位所述书本目录。
具体地,根据实施例四中的方法得到关键词库中的关键词之间的关联关系后,并从输入信息中提取出实体后,假设关键词库中的关键词与书本目录的名称不是一一对应,即关键词库中存在关键词与书本目录的名称无对应关系的情况。当在关键词库中查找到与输入信息的实体匹配的目标关键词后,若目标关键词与书本目录的名称对应时,则直接根据目标关键词与书本目录的名称的对应关系在书本目录中定位到对应的名称。
当目标关键词与书本目录的名称不对应时,根据关键词库中的关键词之间的关联关系,在关键词库中查找目标关键词的上级关键词和/或下级关键词,然后根据上级关键词和/或下级关键词与书本目录的名称之间的对应关系在书本目录中定位到对应的名称。本实施例根据目标关键词的上级关键词和/或下级关键词在书本目录中定位到对应的名称,可增加定位到对应的名称的概率,提高用户的使用体验。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种书本目录的定位方法,其特征在于,包括:
获取大量用户学习时产生的语料信息;
根据所述语料信息构建关键词库;
所述根据所述语料信息构建关键词库具体包括:
对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
提取每个语义槽的关键词,构建关键词库;
将所述关键词库中的关键词与书本目录的名称对应;
获取当前用户的输入信息,并提取出所述输入信息中的实体;
根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录;
所述根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录具体包括:
在所述语义槽中查找与所述输入信息中的实体匹配的语义槽作为目标语义槽;
获取所述目标语义槽的关键词作为目标关键词;
根据所述关键词库中的关键词与书本目录的名称的对应关系,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
根据所述目标名称定位所述书本目录。
2.根据权利要求1所述的一种书本目录的定位方法,其特征在于,所述根据所述语料信息构建关键词库之后,所述将所述关键词库中的关键词与书本目录的名称对应之前还包括:
建立所述关键词库中的关键词之间的关联关系;
所述根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录具体包括:
根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
3.根据权利要求2所述的一种书本目录的定位方法,其特征在于,所述根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录具体包括:
在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
根据所述目标名称定位所述书本目录。
4.一种书本目录的定位系统,其特征在于,包括:
语料信息获取模块,用于获取大量用户学习时产生的语料信息;
关键词库构建模块,用于根据所述语料信息构建关键词库;
所述关键词库构建模块包括:
语义槽形成单元,用于对所述语料信息进行分词处理,提取每条语料信息中的实体,将语义相同的实体形成一个语义槽;
关键词库构建单元,用于提取每个语义槽的关键词,构建关键词库;
对应关系建立模块,用于将所述关键词库中的关键词与书本目录的名称对应;
实体提取模块,用于获取当前用户的输入信息,并提取出所述输入信息中的实体;
目录定位模块,用于根据所述输入信息中的实体、所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录;
所述目录定位模块包括:
目标语义槽查找单元,用于在所述语义槽中查找与所述输入信息中的实体匹配的语义槽作为目标语义槽;
目标关键词获取单元,用于获取所述目标语义槽的关键词作为目标关键词;
目标名称查找单元,用于根据所述关键词库中的关键词与书本目录的名称的对应关系,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
目录定位单元,用于根据所述目标名称定位所述书本目录。
5.根据权利要求4所述的一种书本目录的定位系统,其特征在于,还包括:
关联关系建立模块,用于建立所述关键词库中的关键词之间的关联关系;
所述目录定位模块包括:
目录定位单元,用于根据所述输入信息中的实体、所述关键词库中的关键词之间的关联关系及所述关键词库中的关键词与书本目录的名称的对应关系,定位书本目录。
6.根据权利要求5所述的一种书本目录的定位系统,其特征在于,所述目录定位单元包括:
目标关键词查找子单元,用于在所述关键词库中查找与所述输入信息的实体匹配的关键词作为目标关键词;
判断子单元,用于根据所述关键词库中的关键词与书本目录的名称的对应关系,判断所述目标关键词是否与书本目录的名称对应;
目标名称查找子单元,用于当所述目标关键词与所述书本目录的名称对应时,在所述书本目录中查找与所述目标关键词对应的名称作为目标名称;
所述目标名称查找子单元,还用于当所述目标关键词与所述书本目录的名称不对应时,根据所述关键词库中的关键词之间的关联关系,在所述关键词库中查找所述目标关键词的上级关键词和/或下级关键词,在所述书本目录中查找与所述上级关键词和/或所述下级关键词对应的名称作为目标名称;
定位子单元,用于根据所述目标名称定位所述书本目录。
CN201910047101.7A 2019-01-18 2019-01-18 一种书本目录的定位方法及系统 Active CN109766415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910047101.7A CN109766415B (zh) 2019-01-18 2019-01-18 一种书本目录的定位方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910047101.7A CN109766415B (zh) 2019-01-18 2019-01-18 一种书本目录的定位方法及系统

Publications (2)

Publication Number Publication Date
CN109766415A CN109766415A (zh) 2019-05-17
CN109766415B true CN109766415B (zh) 2022-05-06

Family

ID=66454149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910047101.7A Active CN109766415B (zh) 2019-01-18 2019-01-18 一种书本目录的定位方法及系统

Country Status (1)

Country Link
CN (1) CN109766415B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186643A (zh) * 2011-12-30 2013-07-03 安凯(广州)微电子技术有限公司 一种实现教学内容关联的自主学习方法、终端及系统
CN104361028A (zh) * 2014-10-23 2015-02-18 明博教育科技有限公司 一种根据书籍目录提取书籍知识点的方法及系统
CN104484339A (zh) * 2014-11-21 2015-04-01 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN106407362A (zh) * 2016-09-08 2017-02-15 福建中金在线信息科技有限公司 一种关键词信息检索的方法及装置
CN106503239A (zh) * 2016-11-07 2017-03-15 上海智臻智能网络科技股份有限公司 一种法律信息查询的方法和装置
CN107085583A (zh) * 2016-10-27 2017-08-22 中国长城科技集团股份有限公司 一种基于内容的电子文档管理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8914368B2 (en) * 2010-03-31 2014-12-16 International Business Machines Corporation Augmented and cross-service tagging

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186643A (zh) * 2011-12-30 2013-07-03 安凯(广州)微电子技术有限公司 一种实现教学内容关联的自主学习方法、终端及系统
CN104361028A (zh) * 2014-10-23 2015-02-18 明博教育科技有限公司 一种根据书籍目录提取书籍知识点的方法及系统
CN104484339A (zh) * 2014-11-21 2015-04-01 百度在线网络技术(北京)有限公司 一种相关实体推荐方法和系统
CN106407362A (zh) * 2016-09-08 2017-02-15 福建中金在线信息科技有限公司 一种关键词信息检索的方法及装置
CN107085583A (zh) * 2016-10-27 2017-08-22 中国长城科技集团股份有限公司 一种基于内容的电子文档管理方法及装置
CN106503239A (zh) * 2016-11-07 2017-03-15 上海智臻智能网络科技股份有限公司 一种法律信息查询的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于用户认知风格的知识导航要素使用实证研究;吴江等;《情报探索》;20150630;第64-69页 *

Also Published As

Publication number Publication date
CN109766415A (zh) 2019-05-17

Similar Documents

Publication Publication Date Title
CN110020424B (zh) 合同信息的提取方法、装置和文本信息的提取方法
CN107657048B (zh) 用户识别方法及装置
JP2005085285A5 (zh)
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
CN111797214A (zh) 基于faq数据库的问题筛选方法、装置、计算机设备及介质
CN110795627B (zh) 信息推荐方法及装置、电子设备
CN101499062A (zh) 用于收集实体别名的方法和设备
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
CN103186574A (zh) 一种搜索结果的生成方法和装置
CN107844493B (zh) 一种文件关联方法及系统
EP3232336A1 (en) Method and device for recognizing stop word
CN106055539A (zh) 姓名消歧的方法和装置
Mahdabi et al. The effect of citation analysis on query expansion for patent retrieval
CN105512333A (zh) 基于情感倾向的产品评论主题搜索方法
CN111198936B (zh) 一种语音搜索方法、装置、电子设备及存储介质
KR101638535B1 (ko) 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체
CN103927339B (zh) 知识重组系统和知识重组方法
CN112507176A (zh) 域名侵权的自动化判定方法、装置、电子设备和存储介质
CN108345694B (zh) 一种基于主题数据库的文献检索方法及系统
CN103226601A (zh) 一种图片搜索的方法和装置
CN108509449B (zh) 一种信息处理的方法及服务器
CN111309926B (zh) 一种实体链接方法、装置及电子设备
CN111966899A (zh) 搜索排序方法、系统及计算机可读存储介质
CN109766415B (zh) 一种书本目录的定位方法及系统
CN112445895B (zh) 一种识别用户搜索场景的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant