CN107748744B - 一种勾勒框知识库的建立方法及装置 - Google Patents
一种勾勒框知识库的建立方法及装置 Download PDFInfo
- Publication number
- CN107748744B CN107748744B CN201711047966.0A CN201711047966A CN107748744B CN 107748744 B CN107748744 B CN 107748744B CN 201711047966 A CN201711047966 A CN 201711047966A CN 107748744 B CN107748744 B CN 107748744B
- Authority
- CN
- China
- Prior art keywords
- target
- segmentation result
- frame
- segmentation
- delineation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例公开了一种勾勒框知识库的建立方法及装置,该方法包括:在目标点读内容中提取目标勾勒框;按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果;建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。本发明实施例能够将目标勾勒框中的信息切分至最小单位,实现目标勾勒框的数据颗粒化,提升了目标点读内容中数据的灵活性,为用户提供基于目标切分结果的知识内容,增强了用户的学习效果,能够满足用户的学习需求,提升了用户体验感。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种勾勒框知识库的建立方法及装置。
背景技术
随着社会的不断发展和进步,人民生活水平的不断提高,人们对教育水平和教育质量的要求越来越高,随之而来的是家庭对孩子的教育需求越来越多,能够帮助孩子的电子学习产品受到了家长们的喜爱。点读机,又称为智能电脑读书机,是现代数码信息技术与最新教学需求完美结合的一种有声互动学习产品,将文字化的书面内容变为能够发声的学习教材,为用户的学习带来了极大的便利。
现有技术中的点读机,学习信息是以勾勒框的形式存在的,勾勒框是使用工具将用户需要学习的信息勾勒在轮廓框中,当用户点击勾勒框时,语音教学对应的勾勒框的内容。但是,勾勒框的内容一般为词或者句子,数据的灵活性低,当用户需要学习比词还小的语言组成单位时,点读机将无法满足用户的需求。
发明内容
本发明实施例提供一种勾勒框知识库的建立方法及装置,以解决现有技术中数据灵活性低的问题。
第一方面,本发明实施例提供了一种勾勒框知识库的建立方法,包括:
在目标点读内容中提取目标勾勒框;
按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果;
建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。
进一步地,所述切分单位包括:句、词以及字,所述字包括单个字母或者单个汉字。
进一步地,按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果,包括:
根据第一预设坐标,以句为第一切分单位对所述目标勾勒框进行信息切分,获取与所述第一切分单位匹配的第一切分结果;
根据第二预设坐标,以词为第二切分单位对所述目标勾勒框进行信息切分,获取与所述第二切分单位匹配的第二切分结果;
根据第三预设坐标,以字为第三切分单位对所述目标勾勒框进行信息切分,获取与所述第三切分单位匹配的第三切分结果。
进一步地,建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中,包括:
如果确定所述勾勒框知识库中不存在包括所述目标切分结果的对应关系,则根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容;
建立所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系存储于所述勾勒框知识库中。
进一步地,建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中,还包括:
如果确定所述勾勒框知识库中存在包括有所述目标切分结果的目标对应关系,则将所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置,添加于所述勾勒框知识库中的所述目标对应关系中。
进一步地,根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容,包括:
如果确定与所述目标切分结果匹配的切分单位为句,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义、包括语法、应用场景以及作文素材的图片和视频;
如果确定与所述目标切分结果匹配的切分单位为词,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括近义词、反义词、造句以及文章的图片和视频;
如果确定与所述目标切分结果匹配的切分单位为字,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括笔画笔顺的图片和视频。
进一步地,根据不同点读内容之间的章节关系,建立不同勾勒框之间的逻辑关系存储于所述勾勒框知识库中。
进一步地,如果确定所述目标点读内容的所述目标勾勒框中包含错误信息,则检查所述错误信息在所述目标点读内容的所述目标勾勒框的位置,以及与所述目标勾勒框存在逻辑关系的其它勾勒框的位置,以获取所述目标点读内容中全部的所述错误信息;
获取所述错误信息对应的目标切分结果,在对所述目标切分结果修改完成之后,更新所述勾勒框知识库中在所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系。
进一步地,所述目标知识内容包括至少一个目标知识类别以及与所述至少一个目标知识类别匹配的至少一个待学习知识内容。
第二方面,本发明实施例还提供了一种勾勒框知识库的建立装置,包括:
勾勒框提取模块,用于在目标点读内容中提取目标勾勒框;
信息切分模块,用于按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果;
勾勒框知识库建立模块,用于建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。
本发明实施例通过对目标点读内容的目标勾勒框进行信息切分,在勾勒框知识库中建立目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系,能够将目标勾勒框中的信息切分至最小单位,实现目标勾勒框的数据颗粒化,提升了目标点读内容中数据的灵活性,为用户提供基于目标切分结果的知识内容,增强了用户的学习效果,能够满足用户的学习需求,提升了用户体验感。
附图说明
图1是本发明实施例一中的一种勾勒框知识库的建立方法的流程图;
图2是本发明实施例二中的一种勾勒框知识库的建立方法的流程图;
图3是本发明实施例三中的一种勾勒框知识库的建立方法的流程图;
图4是本发明实施例四中的一种勾勒框知识库的建立方法的流程图;
图5是本发明实施例五中的一种勾勒框知识库的建立装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种勾勒框知识库的建立方法的流程图,本实施例可适用于对用户使用的点读教材内容进行建立勾勒框知识库的情况(勾勒框知识库基于不同点读教材内容动态更新),该方法可以由一种勾勒框知识库的建立装置来执行,该装置可以采用软件和/或硬件的方式实现,并一般可集成于云端服务器中。如图1所示,本实施例的方法具体包括:
S110、在目标点读内容中提取目标勾勒框。
具体的,不同的学科可以具有不同的点读教材,不同的点读教材包括不同的点读内容,将待建立勾勒框知识库的点读内容作为目标点读内容。目标点读内容可以按照页码进行划分,目标点读内容的每一页中包含的目标勾勒框的数量可以不相同。在目标点读内容中可以按页提取目标勾勒框,从目标点读内容的每一页中提取该页所有的目标勾勒框,每一页的页码与该页中的目标勾勒框具有对应关系。也可以在目标点读内容中按照顺序提取目标勾勒框,对提取后的目标勾勒框进行顺序编号,可以根据编号查找到目标勾勒框,本发明对此不做限制。
S120、按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果。
发明人通过研究发现,使用不同的坐标对勾勒框进行信息切分,可以获取与不同的坐标对应的不同的目标切分结果。可以根据目标勾勒框中信息的格式设置坐标,例如,根据信息的行间距以及字符间距设置坐标。根据不同的需求,可以使用不同的坐标对目标勾勒框的信息进行切分,坐标可以包括横坐标和纵坐标,横坐标和纵坐标可以是固定长度的,也可以是可变长度的,本发明对此不做限制。
具体的,对于在目标点读内容中提取的每一个目标勾勒框,按照至少一个切分单位对所述目标勾勒框进行信息切分,可以将目标勾勒框中的学习内容切分至最小单位,以实现数据的颗粒化。使用不同的切分单位对勾勒框进行信息切分,可以获取不同的目标切分结果。
在本实施例的另一个可选的实施方式中,所述切分单位包括:句、词以及字,所述字包括单个字母或者单个汉字。
具体的,当选择的切分单位为句时,获取与切分单位匹配的坐标,对目标勾勒框中的信息按句切分,获取以句为单位的目标切分结果;当选择的切分单位为词时,获取与切分单位匹配的坐标,对目标勾勒框中的信息按词切分,获取以词为单位的目标切分结果;当选择的切分单位为字时,获取与切分单位匹配的坐标,对目标勾勒框中的信息按字切分,获取以字为单位的目标切分结果,需要说明的是,所述字包括单个汉字或者单个字母,相应的,目标勾勒框中的信息可以包括中文信息或者英文信息。
S130、建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。
具体的,对于目标点读内容中的目标勾勒框通过不同的切分单位获取的不同的目标切分结果,建立目标切分结果以及与目标切分结果匹配的知识内容之间的对应关系,并存储于云端服务器的勾勒框知识库中。云端服务器如果确定接收到客户端发来的关于目标切分结果的知识获取请求,则将从勾勒框知识库中提取的,与目标切分结果匹配的目标知识内容发送至客户端。云端服务器存储的与目标切分结果匹配的知识内容具有多种学习资源类型,可以包括下述至少一项:语音、文本语义、图片以及视频。当目标切分结果以句为单位时,云端服务器存储的与目标切分结果匹配的知识内容根据句子的特性而确定;当目标切分结果以词为单位时,云端服务器存储的与目标切分结果匹配的知识内容根据词语的特性而确定;当目标切分结果以字为单位时,云端服务器存储的与目标切分结果匹配的知识内容根据单个汉字或单个字母的特性而确定。
本发明实施例一提供的一种勾勒框知识库的建立方法,通过对目标点读内容的目标勾勒框进行信息切分,在勾勒框知识库中建立目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系,能够将目标勾勒框中的信息切分至最小单位,实现目标勾勒框的数据颗粒化,提升了目标点读内容中数据的灵活性,为用户提供基于目标切分结果的知识内容,增强了用户的学习效果,能够满足用户的学习需求,提升了用户体验感。
实施例二
图2为本发明实施例二提供的一种勾勒框知识库的建立方法的流程图,本发明实施例二以实施例一为基础进行了优化,具体是对按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果的操作进一步优化,如图2所示,本发明实施例的方法具体包括:
S210、在目标点读内容中提取目标勾勒框。
S220、根据第一预设坐标,以句为第一切分单位对所述目标勾勒框进行信息切分,获取与所述第一切分单位匹配的第一切分结果。
具体的,根据实际需求,可以确定对目标勾勒框的第一切分单位为句,可以获取目标勾勒框的长度、宽度、行间距以及字符间距等格式,根据格式确定第一预设坐标的横坐标和/或纵坐标,按照第一预设坐标的横坐标和/或纵坐标,对目标勾勒框进行切分,获取以句为切分单位的第一切分结果。
S230、根据第二预设坐标,以词为第二切分单位对所述目标勾勒框进行信息切分,获取与所述第二切分单位匹配的第二切分结果。
具体的,根据实际需求,可以确定对目标勾勒框的第二切分单位为词,可以获取目标勾勒框的长度、宽度、行间距以及字符间距等格式,根据格式确定第二预设坐标的横坐标和/或纵坐标,按照第二预设坐标的横坐标和/或纵坐标,对目标勾勒框进行切分,获取以词为切分单位的第二切分结果。
S240、根据第三预设坐标,以字为第三切分单位对所述目标勾勒框进行信息切分,获取与所述第三切分单位匹配的第三切分结果。
具体的,根据实际需求,可以确定对目标勾勒框的第三切分单位为字,可以获取目标勾勒框的长度、宽度、行间距以及字符间距等格式,根据格式确定第三预设坐标的横坐标和/或纵坐标,按照第三预设坐标的横坐标和/或纵坐标,对目标勾勒框进行切分,获取以字为切分单位的第三切分结果。
S250、建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。
本发明实施例二提供的一种勾勒框知识库的建立方法,可以根据实际需求,确定切分单位,并根据切分单位确定切分坐标,使用切分坐标对目标勾勒框中的信息进行切分,实现目标勾勒框的数据颗粒化,有效地提升了目标点读内容中数据的灵活性,对颗粒化的数据可以基于不同的规则进行组合,以增强数据的支撑力度。
实施例三
图3为本发明实施例三提供的一种勾勒框知识库的建立方法的流程图,本发明实施例三以上述各实施例为基础进行了优化改进,对建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中进行了进一步说明,如图3所示,本发明实施例三的方法具体包括:
S310、在目标点读内容中提取目标勾勒框。
S320、按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果。
S330、判断所述勾勒框知识库中是否存在包括所述目标切分结果的对应关系,若否,则执行S340,若是,执行S360。
具体的,对于通过不同切分单位获取的不同的切分结果,以及与不同的切分结果匹配的不同的知识内容,在云端服务器中仅存储一次。即获取以句为切分单位的第一目标切分结果时,检测云服务器的勾勒框知识库中是否存在第一目标切分结果,以及与第一目标切分结果匹配的知识内容之间的对应关系。获取以词为切分单位的第二目标切分结果时,检测云服务器的勾勒框知识库中是否存在第二目标切分结果,以及与第二目标切分结果匹配的知识内容之间的对应关系。获取以字为切分单位的第三目标切分结果时,检测云服务器的勾勒框知识库中是否存在第三目标切分结果,以及与第三目标切分结果匹配的知识内容之间的对应关系。
S340、根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容。
优选的,根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容,包括:
如果确定与所述目标切分结果匹配的切分单位为句,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义、包括语法、应用场景以及作文素材的图片和视频;
如果确定与所述目标切分结果匹配的切分单位为词,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括近义词、反义词、造句以及文章的图片和视频;
如果确定与所述目标切分结果匹配的切分单位为字,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括笔画笔顺的图片和视频。
S350、建立所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系存储于所述勾勒框知识库中。
优选的,所述目标知识内容包括至少一个目标知识类别以及与所述至少一个目标知识类别匹配的至少一个待学习知识内容。
具体的,如果云端服务器的勾勒框知识库中没有存在目标切分结果,以及与目标切分结果匹配的知识内容之间的对应关系,即目标切分结果是首次出现,或者不存在目标切分结果对应的知识内容,则首先获取与目标切分结果匹配的目标知识内容。
具体的,如果确定获取到以句为切分单位的第一目标切分结果时,则获取与第一目标切分结果匹配的目标知识内容,示例性地,如果第一目标切分结果为中文时,目标知识内容可以包括下述至少一项:第一目标切分结果的语音拼音、文本语义、语法结构、应用场景、作文素材以及相关联语句等,对于语法结构、应用场景、作文素材以及相关联语句等,可以以图片或者视频的形式存在。如果第一目标切分结果为英文时,目标知识内容可以包括下述至少一项:第一目标切分结果的读音、汉语释义、语法结构、应用场景以及作文素材等,对于语法结构、应用场景以及作文素材等,可以以图片或者视频的形式存在。
如果确定获取到以词为切分单位的第二目标切分结果时,则获取与第二目标切分结果匹配的目标知识内容,示例性地,如果第二目标切分结果为中文时,目标知识内容可以包括下述至少一项:第二目标切分结果的语音拼音、文本语义、近义词、反义词、造句、短文以及作文等,对于近义词、反义词、造句、短文以及作文等,可以以图片或者视频的形式存在。如果第二目标切分结果为英文时,目标知识内容可以包括下述至少一项:第二目标切分结果的读音、汉语释义、近义词、反义词、造句、短文以及作文等,对于近义词、反义词、造句、短文以及作文等,可以以图片或者视频的形式存在。
如果确定获取到以字为切分单位的第三目标切分结果时,则获取与第三目标切分结果匹配的目标知识内容,示例性地,如果第三目标切分结果为中文时,即第三目标切分结果可以为单个汉字,目标知识内容可以包括下述至少一项:第三目标切分结果的语音拼音、语音、文本语义、笔画笔顺以及偏旁部首等,对于笔画笔顺以及偏旁部首等,可以以图片或者视频的形式存在。如果第三目标切分结果为英文时,即第三目标切分结果可以为单个字母,目标知识内容可以包括下述至少一项:第三目标切分结果的读音、文本语义、笔画笔顺以及与汉语拼音的区别等,对于笔画笔顺以及与汉语拼音的区别等,可以以图片或者视频的形式存在。
在获取到与目标切分结果匹配的目标知识内容之后,建立目标切分结果、目标知识内容、以及目标切分结果在目标点读内容的目标勾勒框中的位置之间的对应关系存储于云端服务器的勾勒框知识库中。示例性地,目标切分结果在目标点读内容的目标勾勒框中的位置,可以理解为目标切分结果在英语点读教材的第七页的第8个勾勒框,或者目标切分结果在语文点读教材的第一页的第7个勾勒框的设定坐标范围内。在云端服务器的勾勒框知识库中,相同的目标切分结果只存储一次,即勾勒框知识库中存储着某一个目标切分结果,以及该目标切分结果在目标点读内容中的至少一个所在位置。云端服务器可以根据客户端发送的用户基于目标点读内容选中的学习内容的位置,识别出相应的目标切分结果。
值得说明的是,勾勒框知识库中的目标知识内容包括至少一个目标知识类别以及与至少一个目标知识类别匹配的至少一个待学习知识内容。即目标知识内容可以按照目标知识类别进行划分。目标知识类别可以理解为知识内容的存在形式,示例性地,如果目标知识内容为中文,则目标知识类别可以包括拼音、笔画笔顺、组词、词语造句、近义词、反义词、短文以及作文素材,如果目标知识内容为英文,则目标知识类别可以包括读音、笔画笔顺、中文释义、近义词、反义词、词语造句以及应用场景。待学习知识内容可以理解为与目标知识类别匹配的,关于目标切分结果的具体知识内容,待学习知识内容是目标知识内容按照目标知识类别划分的结果。
S360、将所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置,添加于所述勾勒框知识库中的所述目标对应关系中。
具体的,如果云端服务器的勾勒框知识库中已经存在目标切分结果,以及与目标切分结果匹配的知识内容之间的对应关系,则将当前的目标切分结果在目标点读内容的目标勾勒框中的位置,添加于勾勒框知识库中已存在的对应关系中,即同一个目标切分结果可以对应不同的位置信息,目标切分结果在云端服务器中仅存储一次,对于目标点读内容中相同的目标切分结果,仅在对应关系中添加目标切分结果的位置。
本实施例中,用户可以在客户端的目标点读内容的勾勒框中选中待学习内容,客户端可以将待学习内容的位置上传至云端服务器,其中,客户端可以为点读机、电子学习机等设备。云端服务器基于勾勒框知识库中存储的目标切分结果、目标知识内容、以及目标切分结果在目标点读内容的目标勾勒框中的位置之间的对应关系,可以根据待学习内容的位置识别出待学习内容对应的目标切分结果,并确定与目标切分结果匹配的目标知识内容。云端服务器可以从勾勒框知识库中提取出目标知识内容,将目标知识内容发送至客户端。
本发明实施例三提供的一种勾勒框知识库的建立方法,对于用户基于目标点读内容选中的学习信息,能够提供多种学习资源类型的知识内容,避免了提供同质化的知识内容带来的学习资源类型单一性的结果,有效地提升了用户的学习兴趣,能够帮助用户增强学习效果,提升了用户体验感。
实施例四
图4为本发明实施例四提供的一种方法的流程图,本发明实施例四以上述各实施例为基础进行了优化改进,具体是对建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中之后的操作进行了优化,如图4所示,本发明实施例四的方法具体包括:
S410、在目标点读内容中提取目标勾勒框。
S420、按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果。
S430、建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。
S440、根据不同点读内容之间的章节关系,建立不同勾勒框之间的逻辑关系存储于所述勾勒框知识库中。
S450、判断所述目标点读内容的所述目标勾勒框中是否包含错误信息,若是,则执行S460,否则,退出流程。
S460、检查所述错误信息在所述目标点读内容的所述目标勾勒框的位置,以及与所述目标勾勒框存在逻辑关系的其它勾勒框的位置,以获取所述目标点读内容中全部的所述错误信息。
S470、获取所述错误信息对应的目标切分结果,在对所述目标切分结果修改完成之后,更新所述勾勒框知识库中在所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系。
具体的,在同一种点读教材的不同的点读内容之间存在章节关系,相应的,点读内容中的不同的勾勒框之间存在逻辑关系,类似于一本书中的内容之间具有章节关系,内容中包括的知识点之间存在逻辑关系。云端服务器还可以根据不同点读内容之间的章节关系,建立不同勾勒框之间的逻辑关系,并将逻辑关系存储于勾勒框知识库中。此外,不同页码下的勾勒框之间可以存在逻辑关系。
在目标点读内容中的目标勾勒框的目标切分结果、目标知识内容、以及目标切分结果在目标点读内容的目标勾勒框中的位置之间的对应关系建立之后,判断目标点读内容的目标勾勒框中是否包含错误信息。如果确定目标点读内容的目标勾勒框中存在错误信息,则根据错误信息在目标点读内容的目标勾勒框中的位置,识别出错误信息对应的目标切分结果,其中,目标切分结果可以为具体的句子、词汇、汉字或字母。获取目标切分结果对应的目标切分结果在目标点读内容的目标勾勒框中的位置,查找目标切分结果对应的全部位置中是否也包含错误信息,并进一步地检查与错误信息所在的勾勒框存在逻辑关系的其它勾勒框,以获取全部的错误信息。云端服务器按照错误信息对应的切分结果修改错误信息,在修改完成后,更新云端服务器中在目标切分结果、目标知识内容、以及目标切分结果在目标点读内容的目标勾勒框中的位置之间的对应关系。示例性地,由于已经将目标点读内容的目标勾勒框以字为切分单位进行了信息切分,如果目标点读内容的目标勾勒框中将“太阳”写成了“大阳”,存在错误信息,则可以直接通过目标切分结果修改错误信息,将“大”修改为“太”,修改的内容可以具体准确到字,在修改完成后更新修改后的目标切分结果、修改后的目标切分结果对应的目标点读内容,以及修改后的目标切分结果在目标点读内容的所述目标勾勒框中的位置之间的对应关系。
本发明实施例四提供的一种勾勒框知识库的建立方法,可以实现勾勒框知识库中的数据是经过切分的颗粒化数据,支持对目标点读内容的目标勾勒框中小单位信息的搜索支撑,同时,对于目标勾勒框中存在的错误信息,可以准确获取所有错误信息的位置,并对错误信息进行精确到字的修改,避免了对错误信息进行整体修改的繁琐性,简便了错误信息修改的流程,提升了数据的灵活性。
实施例五
图5是本发明实施例五中的一种勾勒框知识库的建立装置的结构示意图,该装置应用于对用户使用的点读教材内容进行建立勾勒框知识库的情况(勾勒框知识库基于不同点读教材内容动态更新),该装置可以采用软件和/或硬件的方式实现,并一般可集成于云端服务器中。如图5所示,装置包括:勾勒框提取模块510、信息切分模块520以及勾勒框知识库建立模块530,其中:
勾勒框提取模块510,用于在目标点读内容中提取目标勾勒框;
信息切分模块520,用于按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果;
勾勒框知识库建立模块530,用于建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中。
本发明实施例通过对目标点读内容的目标勾勒框进行信息切分,在勾勒框知识库中建立目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系,能够将目标勾勒框中的信息切分至最小单位,实现目标勾勒框的数据颗粒化,提升了目标点读内容中数据的灵活性,为用户提供基于目标切分结果的知识内容,增强了用户的学习效果,能够满足用户的学习需求,提升了用户体验感。
在上述实施例的基础上,所述切分单位可以包括:句、词以及字,所述字包括单个字母或者单个汉字。
在上述实施例的基础上,所述信息切分模块可以包括:
第一信息切分单元,用于根据第一预设坐标,以句为第一切分单位对所述目标勾勒框进行信息切分,获取与所述第一切分单位匹配的第一切分结果;
第二信息切分单元,用于根据第二预设坐标,以词为第二切分单位对所述目标勾勒框进行信息切分,获取与所述第二切分单位匹配的第二切分结果;
第三信息切分单元,用于根据第三预设坐标,以字为第三切分单位对所述目标勾勒框进行信息切分,获取与所述第三切分单位匹配的第三切分结果。
在上述实施例的基础上,所述勾勒框知识库建立模块可以包括:
目标知识内容获取单元,用于如果确定所述勾勒框知识库中不存在包括所述目标切分结果的对应关系,则根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容;
第一关系建立单元,用于建立所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系存储于所述勾勒框知识库中。
在上述实施例的基础上,所述勾勒框知识库建立模块还可以包括:
位置添加单元,用于如果确定所述勾勒框知识库中存在包括有所述目标切分结果的目标对应关系,则将所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置,添加于所述勾勒框知识库中的所述目标对应关系中。
在上述实施例的基础上,所述目标知识内容获取单元可以包括:
第一获取子单元,用于如果确定与所述目标切分结果匹配的切分单位为句,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义、包括语法、应用场景以及作文素材的图片和视频;
第二获取子单元,用于如果确定与所述目标切分结果匹配的切分单位为词,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括近义词、反义词、造句以及文章的图片和视频;
第三获取子单元,用于如果确定与所述目标切分结果匹配的切分单位为字,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括笔画笔顺的图片和视频。
在上述实施例的基础上,所述装置还可以包括:
第二关系建立单元,用于根据不同点读内容之间的章节关系,建立不同勾勒框之间的逻辑关系存储于所述勾勒框知识库中。
在上述实施例的基础上,所述装置还可以包括:
错误信息检查单元,用于如果确定所述目标点读内容的所述目标勾勒框中包含错误信息,则检查所述错误信息在所述目标点读内容的所述目标勾勒框的位置,以及与所述目标勾勒框存在逻辑关系的其它勾勒框的位置,以获取所述目标点读内容中全部的所述错误信息;
错误信息修改单元,用于获取所述错误信息对应的目标切分结果,在对所述目标切分结果修改完成之后,更新所述勾勒框知识库中在所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系。
在上述实施例的基础上,所述目标知识内容可以包括至少一个目标知识类别以及与所述至少一个目标知识类别匹配的至少一个待学习知识内容。
本发明实施例提供的一种勾勒框知识库的建立装置可执行本发明任意实施例提供的一种勾勒框知识库的建立方法,具备执行一种勾勒框知识库的建立方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (8)
1.一种勾勒框知识库的建立方法,其特征在于,包括:
在目标点读内容中提取目标勾勒框;
按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果;
建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中;
根据不同点读内容之间的章节关系,建立不同勾勒框之间的逻辑关系存储于所述勾勒框知识库中;
如果确定所述目标点读内容的所述目标勾勒框中包含错误信息,则检查所述错误信息在所述目标点读内容的所述目标勾勒框的位置,以及与所述目标勾勒框存在逻辑关系的其它勾勒框的位置,以获取所述目标点读内容中全部的所述错误信息;
获取所述错误信息对应的目标切分结果,在对所述目标切分结果修改完成之后,更新所述勾勒框知识库中在所述目标切分结果、目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系。
2.根据权利要求1所述的方法,其特征在于,所述切分单位包括:句、词以及字,所述字包括单个字母或者单个汉字。
3.根据权利要求2所述的方法,其特征在于,按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果,包括:
根据第一预设坐标,以句为第一切分单位对所述目标勾勒框进行信息切分,获取与所述第一切分单位匹配的第一切分结果;
根据第二预设坐标,以词为第二切分单位对所述目标勾勒框进行信息切分,获取与所述第二切分单位匹配的第二切分结果;
根据第三预设坐标,以字为第三切分单位对所述目标勾勒框进行信息切分,获取与所述第三切分单位匹配的第三切分结果。
4.根据权利要求1-3任一项所述的方法,其特征在于,建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中,包括:
如果确定所述勾勒框知识库中不存在包括所述目标切分结果的对应关系,则根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容;
建立所述目标切分结果、所述目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系存储于所述勾勒框知识库中。
5.根据权利要求4所述的方法,其特征在于,建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中,还包括:
如果确定所述勾勒框知识库中存在包括有所述目标切分结果的目标对应关系,则将所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置,添加于所述勾勒框知识库中的所述目标对应关系中。
6.根据权利要求4所述的方法,其特征在于,根据与所述目标切分结果匹配的切分单位,获取与所述目标切分结果匹配的目标知识内容,包括:
如果确定与所述目标切分结果匹配的切分单位为句,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义、包括语法、应用场景以及作文素材的图片和视频;
如果确定与所述目标切分结果匹配的切分单位为词,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括近义词、反义词、造句以及文章的图片和视频;
如果确定与所述目标切分结果匹配的切分单位为字,则获取与所述目标切分结果匹配的目标知识内容包括下述至少一项:语音、文本语义以及包括笔画笔顺的图片和视频。
7.根据权利要求4所述的方法,其特征在于,所述目标知识内容包括至少一个目标知识类别以及与所述至少一个目标知识类别匹配的至少一个待学习知识内容。
8.一种勾勒框知识库的建立装置,其特征在于,包括:
勾勒框提取模块,用于在目标点读内容中提取目标勾勒框;
信息切分模块,用于按照至少一个切分单位对所述目标勾勒框进行信息切分,获取与所述至少一个切分单位匹配的至少一个目标切分结果;
勾勒框知识库建立模块,用于建立所述目标点读内容中的所述目标勾勒框的所述目标切分结果,以及与所述目标切分结果匹配的知识内容之间的对应关系存储于勾勒框知识库中;
根据不同点读内容之间的章节关系,建立不同勾勒框之间的逻辑关系存储于所述勾勒框知识库中;
如果确定所述目标点读内容的所述目标勾勒框中包含错误信息,则检查所述错误信息在所述目标点读内容的所述目标勾勒框的位置,以及与所述目标勾勒框存在逻辑关系的其它勾勒框的位置,以获取所述目标点读内容中全部的所述错误信息;
获取所述错误信息对应的目标切分结果,在对所述目标切分结果修改完成之后,更新所述勾勒框知识库中在所述目标切分结果、目标知识内容、以及所述目标切分结果在所述目标点读内容的所述目标勾勒框中的位置之间的对应关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711047966.0A CN107748744B (zh) | 2017-10-31 | 2017-10-31 | 一种勾勒框知识库的建立方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711047966.0A CN107748744B (zh) | 2017-10-31 | 2017-10-31 | 一种勾勒框知识库的建立方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107748744A CN107748744A (zh) | 2018-03-02 |
CN107748744B true CN107748744B (zh) | 2021-01-26 |
Family
ID=61253389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711047966.0A Active CN107748744B (zh) | 2017-10-31 | 2017-10-31 | 一种勾勒框知识库的建立方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107748744B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079497B (zh) * | 2019-06-09 | 2024-02-23 | 广东小天才科技有限公司 | 基于点读场景的点读内容识别方法及装置 |
CN111078067A (zh) * | 2019-06-09 | 2020-04-28 | 广东小天才科技有限公司 | 一种信息定位方法及电子设备 |
CN111090343B (zh) * | 2019-06-09 | 2024-03-19 | 广东小天才科技有限公司 | 在点读场景下识别点读内容的方法及装置 |
CN111078083A (zh) * | 2019-06-09 | 2020-04-28 | 广东小天才科技有限公司 | 一种点读内容的确定方法及电子设备 |
CN110634342A (zh) * | 2019-09-19 | 2019-12-31 | 广东小天才科技有限公司 | 一种勾勒框的识别方法、系统、存储介质及电子设备 |
CN112115709B (zh) * | 2020-09-16 | 2021-06-04 | 北京嘀嘀无限科技发展有限公司 | 实体识别方法、装置、存储介质和电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187984A (ja) * | 1996-12-26 | 1998-07-21 | Sony Corp | 画像照合装置 |
CN1290371A (zh) * | 1998-02-13 | 2001-04-04 | 微软公司 | 中文文本中的字词分割方法 |
CN102354461A (zh) * | 2011-10-14 | 2012-02-15 | 北京市莱科智多教育科技有限公司 | 点读系统及其点读装置客户端、服务器和点读方法 |
CN103236195A (zh) * | 2013-04-22 | 2013-08-07 | 中山大学 | 一种在线点读笔系统及其点读方法 |
CN103838866A (zh) * | 2014-03-20 | 2014-06-04 | 广东小天才科技有限公司 | 一种文本转换方法及装置 |
CN104050838A (zh) * | 2014-07-15 | 2014-09-17 | 北京网梯科技发展有限公司 | 一种能够识别与点读普通印刷物的点读系统、设备及方法 |
CN104123857A (zh) * | 2014-07-16 | 2014-10-29 | 北京网梯科技发展有限公司 | 一种实现个性化点读的设备及方法 |
CN104199834A (zh) * | 2014-08-04 | 2014-12-10 | 徐�明 | 从信息载体表面交互式获取远程资源并输出的方法及系统 |
CN106057004A (zh) * | 2016-05-26 | 2016-10-26 | 广东小天才科技有限公司 | 一种在线学习方法及装置、移动设备 |
CN107092669A (zh) * | 2017-04-11 | 2017-08-25 | 江苏东方金钰智能机器人有限公司 | 一种建立机器人智能交互的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7526434B2 (en) * | 2001-01-30 | 2009-04-28 | Linda Sharp | Network based system and method for marketing management |
-
2017
- 2017-10-31 CN CN201711047966.0A patent/CN107748744B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10187984A (ja) * | 1996-12-26 | 1998-07-21 | Sony Corp | 画像照合装置 |
CN1290371A (zh) * | 1998-02-13 | 2001-04-04 | 微软公司 | 中文文本中的字词分割方法 |
CN102354461A (zh) * | 2011-10-14 | 2012-02-15 | 北京市莱科智多教育科技有限公司 | 点读系统及其点读装置客户端、服务器和点读方法 |
CN103236195A (zh) * | 2013-04-22 | 2013-08-07 | 中山大学 | 一种在线点读笔系统及其点读方法 |
CN103838866A (zh) * | 2014-03-20 | 2014-06-04 | 广东小天才科技有限公司 | 一种文本转换方法及装置 |
CN104050838A (zh) * | 2014-07-15 | 2014-09-17 | 北京网梯科技发展有限公司 | 一种能够识别与点读普通印刷物的点读系统、设备及方法 |
CN104123857A (zh) * | 2014-07-16 | 2014-10-29 | 北京网梯科技发展有限公司 | 一种实现个性化点读的设备及方法 |
CN104199834A (zh) * | 2014-08-04 | 2014-12-10 | 徐�明 | 从信息载体表面交互式获取远程资源并输出的方法及系统 |
CN106057004A (zh) * | 2016-05-26 | 2016-10-26 | 广东小天才科技有限公司 | 一种在线学习方法及装置、移动设备 |
CN107092669A (zh) * | 2017-04-11 | 2017-08-25 | 江苏东方金钰智能机器人有限公司 | 一种建立机器人智能交互的方法 |
Non-Patent Citations (2)
Title |
---|
A variational framework for active and adaptative segmentation of vector valued images;Rousson M 等;《Workshop on Motion and Video Computing》;20021209;56-61 * |
基于JSEG算法的点读机坐标定位方法;熊邦书 等;《半导体光电》;20141215;第35卷(第6期);1101-1105 * |
Also Published As
Publication number | Publication date |
---|---|
CN107748744A (zh) | 2018-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107748744B (zh) | 一种勾勒框知识库的建立方法及装置 | |
CN111738251B (zh) | 一种融合语言模型的光学字符识别方法、装置和电子设备 | |
CN106980624B (zh) | 一种文本数据的处理方法和装置 | |
CN106534548B (zh) | 语音纠错方法和装置 | |
CN111753767A (zh) | 一种作业自动批改的方法、装置、电子设备和存储介质 | |
JP2006190006A5 (zh) | ||
CN109616096A (zh) | 多语种语音解码图的构建方法、装置、服务器和介质 | |
WO2014117553A1 (en) | Method and system of adding punctuation and establishing language model | |
KR20210037637A (ko) | 번역 방법, 장치 및 전자 기기 | |
CN112818089B (zh) | 文本注音方法、电子设备及存储介质 | |
CN114596566B (zh) | 文本识别方法及相关装置 | |
CN105760356A (zh) | 一种英文单词听写题目备选选项自动生成方法及系统 | |
CN109359308B (zh) | 机器翻译方法、装置及可读存储介质 | |
CN110517668A (zh) | 一种中英文混合语音识别系统及方法 | |
US9934449B2 (en) | Methods and systems for detecting topic transitions in a multimedia content | |
CN113255331B (zh) | 文本纠错方法、装置及存储介质 | |
CN112800177B (zh) | 基于复杂数据类型的faq知识库自动生成方法和装置 | |
CN110825874A (zh) | 一种中文文本分类方法和装置及计算机可读存储介质 | |
CN112542163A (zh) | 智能语音交互方法、设备及存储介质 | |
CN115759293A (zh) | 模型训练方法、图像检索方法、装置及电子设备 | |
CN104134081A (zh) | 一种手写输入内容的拼读方法及装置 | |
CN115273057A (zh) | 文本识别方法、装置和听写批改方法、装置及电子设备 | |
CN111582281B (zh) | 一种图片显示优化的方法、装置、电子设备和存储介质 | |
US20160267811A1 (en) | Systems and methods for teaching foreign languages | |
CN107844552A (zh) | 一种勾勒框知识库内容提供方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |