CN103927339B - 知识重组系统和知识重组方法 - Google Patents

知识重组系统和知识重组方法 Download PDF

Info

Publication number
CN103927339B
CN103927339B CN201410119484.1A CN201410119484A CN103927339B CN 103927339 B CN103927339 B CN 103927339B CN 201410119484 A CN201410119484 A CN 201410119484A CN 103927339 B CN103927339 B CN 103927339B
Authority
CN
China
Prior art keywords
knowledge
entry
vocabulary
lexicon
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410119484.1A
Other languages
English (en)
Other versions
CN103927339A (zh
Inventor
陈长刚
百华睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201410119484.1A priority Critical patent/CN103927339B/zh
Publication of CN103927339A publication Critical patent/CN103927339A/zh
Application granted granted Critical
Publication of CN103927339B publication Critical patent/CN103927339B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying

Abstract

本发明提供了一种知识重组系统和知识重组方法,知识重组系统包括:选择单元,根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;查找单元,在预设的本体词汇库中查找出与目标词汇存在关联关系的多个词汇,以组成词汇集;提取单元,在预设的知识条目库中,查找与词汇集中的每个词汇相关联的目标知识条目,并在查找时提取出目标知识条目对应的条目内容;文件生成单元,对提取出的所有条目内容进行汇总,并根据词汇集中每个词汇和其他词汇之间的关联关系确定所有条目内容的排列顺序,以按照排列顺序对所有条目内容进行组合,生成知识文件。通过该技术方案,不但降低了建立关联关系的成本,而且可以生成满足用户不同需求的知识文件。

Description

知识重组系统和知识重组方法
技术领域
本发明涉及数字出版技术领域,具体而言,涉及一种知识重组系统和一种知识重组方法。
背景技术
数字出版应用主要面向专业出版、教育出版以及大众出版三个领域,在专业出版领域中,尤其是科教领域,知识的获取方式正在从传统的标准化推送方式向个性化获取方式转变,基于个性化需求的知识动态重组装置逐渐成为一个重要的研究课题。通过动态重组装置,出版机构能够快速满足读者的个性化需求。
目前知识重组主要是基于检索引擎实现的,通过检索引擎把相关主题词的内容聚合到一起,然后经过人工筛选形成新的出版物。现在主流的检索引擎都是基于分词技术来实现的,会存在以下几方面问题:中文分词不准确,导致查询的知识不够准确,增加人工筛选的难度和工作量;只能检索包含检索词或者有相似词的内容,导致有些看似无关,但是实际和当前知识密切相关的知识不能被检索到。
除了通过正文内容进行全文检索外,也可以通过给知识条目添加关键词或者分类属性方式使检索的结果更加精确,不过由于关键词之间是相互独立的,也只能获取被标注了关键词的知识内容,导致获取的结果内容不够全面。
随着信息技术的发展,本体论逐步被引入到信息技术领域,尤其是人工智能领域,通过领域本体能够更好的描述知识以及知识之间的关联关系,由于领域不同,该方式还没有在数字出版领域进行大规模应用,并且在应用时需要根据实际情况进行完善、改进。
因此,需要一种新的技术方案,可以通过领域本体建立知识之间的关联,为用户提供更加精准的个性化服务,使平台能够给其带来更大的价值,提升平台的粘性。
发明内容
本发明正是基于上述问题,提出了一种新的技术方案,可以通过领域本体建立知识之间的关联,为用户提供更加精准的个性化服务,使平台能够给其带来更大的价值,提升平台的粘性。
有鉴于此,本发明提出了一种知识重组系统,包括:选择单元,用于根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;查找单元,连接至所述选择单元,用于在所述预设的本体词汇库中查找出与所述目标词汇存在关联关系的多个词汇,以组成词汇集;提取单元,连接至所述查找单元,用于在预设的知识条目库中,查找与所述词汇集中的每个词汇相关联的目标知识条目,并在查找到所述目标知识条目时,提取出所述目标知识条目对应的条目内容;文件生成单元,连接至所述提取单元,用于对所述提取单元提取出的所有条目内容进行汇总,并根据所述词汇集中每个词汇和其他词汇之间的关联关系确定所述所有条目内容的排列顺序,以按照所述排列顺序对所述所有条目内容进行组合,生成知识文件。
在该技术方案中,从预设的本体词汇库中选择出目标词汇,通过目标词汇则可在本体词汇库中找到多个词汇,这样,根据多个词汇查找出与其关联的知识条目,通过各词汇之间的关联关系(关联关系包括上位关系,下位关系和同位关系),确定各个知识条目的顺序,从而生成一个符合用户要求的知识文件。这样,不但降低了建立关联关系的成本,而且可以生成满足用户不同需求的知识文件,即快速生成面向某个主题的出版物,为用户提供更加个性化及精准的服务,提升用户的使用体验。在上述技术方案中,优选地,还包括:第一关联单元,连接至所述查找单元,用于根据接收到的关联命令,建立所述预设的本体词汇库中多个词汇之间的关联关系;第二关联单元,连接至所述提取单元,用于根据接收到的关联命令,将所述预设的本体词汇库中的词汇和知识条目库中的知识条目进行关联。
在该技术方案中,为本体词汇库中的多个词汇设置关联关系,并在本体词汇库中的词汇和知识条目库中的知识条目建立关联,这样,只要用户选择目标词汇,就可以在本体词汇库中找到与目标词汇关联的所有词汇,进而根据这些词汇找到对应的知识条目,将这些知识条目按照顺序组合,就可以生成知识文件。
在上述技术方案中,优选地,所述第二关联单元包括:关键词提取单元,用于对所述知识条目库中每个知识条目对应的条目内容进行解析,并获取每个条目内容对应的知识条目特征,其中,所述知识条目特征包括多个关键词;确定单元,用于解析出所述知识条目特征中的多个关键词,将所述多个关键词中的每个关键词和所述预设的本体词汇库中的每个词汇进行比较,并根据比较结果确定与所述知识条目特征对应的词汇,以确定与所述知识条目关联的词汇。
在该技术方案中,当在本体词汇库中的词汇和知识条目库中的至少条目之间建立关联时,可以通过自动推荐和人工调节相配合的方式建立,其中自动推荐即解析知识条目中的关键词,并将解析出的关键词和本体词汇库中的词汇进行比较,从而为知识条目找到与其最匹配的词汇,从而推荐给用户,这样,用户不需要自己一一建立关联关系,降低了降低关联关系的成本。
在上述技术方案中,优选地,还包括:显示单元,连接至所述选择单元和所述文件生成单元,用于对所述知识文件、所述预设的本体词汇库中的词库和/或所述知识条目库中的知识条目进行显示。
在该技术方案中,用户可以直观地查看到知识文件,预设的本体词汇库和知识条目中的内容,这样,为用户提供可视化的界面,方便用户的操作。
在上述技术方案中,优选地,还包括:重组单元,连接至所述显示单元,用于根据接收到的调整命令,对所述知识文件中的条目内容的排列顺序进行调整。
在该技术方案中,用户还可以对生成的知识文件中的条目内容的顺序进行调整,从而保证知识文件的准确性。
根据本发明的另一方面,还提供了一种知识重组方法,包括:根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;在所述预设的本体词汇库中查找出与所述目标词汇存在关联关系的多个词汇,以组成词汇集;在预设的知识条目库中,查找与所述词汇集中的每个词汇相关联的目标知识条目,并在查找到所述目标知识条目时,提取出所述目标知识条目对应的条目内容;对提取出的所有条目内容进行汇总,并根据所述词汇集中每个词汇和其他词汇之间的关联关系确定所述所有条目内容的排列顺序,以按照所述排列顺序对所述所有条目内容进行组合,生成知识文件。
在该技术方案中,从预设的本体词汇库中选择出目标词汇,通过目标词汇则可在本体词汇库中找到多个词汇,这样,根据多个词汇查找出与其关联的知识条目,通过各词汇之间的关联关系(联关系包括上位关系,下位关系和同位关系),确定各个知识条目的顺序,从而生成一个符合用户要求的知识文件。这样,不但降低了建立关联关系的成本,而且可以生成满足用户不同需求的知识文件,即快速生成面向某个主题的出版物,为用户提供更加个性化及精准的服务,提升用户的使用体验。
在上述技术方案中,优选地,还包括:根据接收到的关联命令,建立所述预设的本体词汇库中多个词汇之间的关联关系;根据接收到的关联命令,将所述本体词汇库中的词汇和知识条目库中的知识条目进行关联。
在该技术方案中,为本体词汇库中的多个词汇设置关联关系,并在本体词汇库中的词汇和知识条目库中的知识条目建立关联,这样,只要用户选择目标词汇,就可以在本体词汇库中找到与目标词汇关联的所有词汇,进而根据这些词汇找到对应的知识条目,将这些知识条目按照顺序组合,就可以生成知识文件。
在上述技术方案中,优选地,根据接收到的关联命令,将所述本体词汇库中的词汇和知识条目库中的知识条目进行关联,具体包括:对所述知识条目库中每个知识条目对应的条目内容进行解析,并获取每个条目内容对应的知识条目特征,其中,所述知识条目特征包括多个关键词;解析出所述知识条目特征中的多个关键词,将所述多个关键词中的每个关键词和所述预设的本体词汇库中的每个词汇进行比较,并根据比较结果确定与所述知识条目特征对应的词汇,以确定与所述知识条目关联的词汇。
在该技术方案中,当在本体词汇库中的词汇和知识条目库中的至少条目之间建立关联时,可以通过自动推荐和人工调节相配合的方式建立,其中自动推荐即解析知识条目中的关键词,并将解析出的关键词和本体词汇库中的词汇进行比较,从而为知识条目找到与其最匹配的词汇,从而推荐给用户,这样,用户不需要自己一一建立关联关系,降低了降低关联关系的成本。
在上述技术方案中,优选地,还包括:对所述知识文件、所述预设的本体词汇库中的词库和/或所述知识条目库中的知识条目进行显示。
在该技术方案中,用户可以直观地查看到知识文件,预设的本体词汇库和知识条目中的内容,这样,为用户提供可视化的界面,方便用户的操作。
在上述技术方案中,优选地,还包括:根据接收到的调整命令,对所述知识文件中的条目内容的排列顺序进行调整。
在该技术方案中,用户还可以对生成的知识文件中的条目内容的顺序进行调整,从而保证知识文件的准确性。
通过以上技术方案,可以通过领域本体建立知识之间的关联,为用户提供更加精准的个性化服务,使平台能够给其带来更大的价值,提升平台的粘性。
附图说明
图1示出了根据本发明的实施例的知识重组系统的框图;
图2示出了根据本发明的实施例的知识重组方法的流程图;
图3示出了根据本发明的实施例的知识重组系统的结构图;
图4示出了根据本发明的实施例的知识重组方法的具体流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的知识重组系统的框图。
如图1所示,根据本发明的实施例的知识重组系统100,包括:选择单元102,用于根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;查找单元104,连接至所述选择单元102,用于在所述预设的本体词汇库中查找出与所述目标词汇存在关联关系的多个词汇,以组成词汇集;提取单元106,连接至所述查找单元104,用于在预设的知识条目库中,查找与所述词汇集中的每个词汇相关联的目标知识条目,并在查找到所述目标知识条目时,提取出所述目标知识条目对应的条目内容;文件生成单元108,连接至所述提取单元106,用于对所述提取单元提取出的所有条目内容进行汇总,并根据所述词汇集中每个词汇和其他词汇之间的关联关系确定所述所有条目内容的排列顺序,以按照所述排列顺序对所述所有条目内容进行组合,生成知识文件。
在该技术方案中,从预设的本体词汇库中选择出目标词汇,通过目标词汇则可在本体词汇库中找到多个词汇,这样,根据多个词汇查找出与其关联的知识条目,通过各词汇之间的关联关系(关联关系包括上位关系,下位关系和同位关系),确定各个知识条目的顺序,从而生成一个符合用户要求的知识文件。这样,不但降低了建立关联关系的成本,而且可以生成满足用户不同需求的知识文件,即快速生成面向某个主题的出版物,为用户提供更加个性化及精准的服务,提升用户的使用体验。
在上述技术方案中,优选地,还包括:第一关联单元110,连接至所述查找单元104,用于根据接收到的关联命令,建立所述预设的本体词汇库中多个词汇之间的关联关系;第二关联单元112,连接至所述提取单元106,用于根据接收到的关联命令,将所述预设的本体词汇库中的词汇和知识条目库中的知识条目进行关联。
在该技术方案中,为本体词汇库中的多个词汇设置关联关系,并在本体词汇库中的词汇和知识条目库中的知识条目建立关联,这样,只要用户选择目标词汇,就可以在本体词汇库中找到与目标词汇关联的所有词汇,进而根据这些词汇找到对应的知识条目,将这些知识条目按照顺序组合,就可以生成知识文件。
在上述技术方案中,优选地,所述第二关联单元112包括:关键词提取单元1122,用于对所述知识条目库中每个知识条目对应的条目内容进行解析,并获取每个条目内容对应的知识条目特征,其中,所述知识条目特征包括多个关键词;确定单元1124,用于解析出所述知识条目特征中的多个关键词,将所述多个关键词中的每个关键词和所述预设的本体词汇库中的每个词汇进行比较,并根据比较结果确定与所述知识条目特征对应的词汇,以确定与所述知识条目关联的词汇。
在该技术方案中,当在本体词汇库中的词汇和知识条目库中的至少条目之间建立关联时,可以通过自动推荐和人工调节相配合的方式建立,其中自动推荐即解析知识条目中的关键词,并将解析出的关键词和本体词汇库中的词汇进行比较,从而为知识条目找到与其最匹配的词汇,从而推荐给用户,这样,用户不需要自己一一建立关联关系,降低了降低关联关系的成本。
在上述技术方案中,优选地,还包括:显示单元114,连接至所述选择单元102和所述文件生成单元108,用于对所述知识文件、所述预设的本体词汇库中的词库和/或所述知识条目库中的知识条目进行显示。
在该技术方案中,用户可以直观地查看到知识文件,预设的本体词汇库和知识条目中的内容,这样,为用户提供可视化的界面,方便用户的操作。
在上述技术方案中,优选地,还包括:重组单元116,连接至所述显示单元114,用于根据接收到的调整命令,对所述知识文件中的条目内容的排列顺序进行调整。
在该技术方案中,用户还可以对生成的知识文件中的条目内容的顺序进行调整,从而保证知识文件的准确性。
图2示出了根据本发明的实施例的知识重组方法的流程图。
如图2所示,根据本发明的实施例的知识重组方法,包括:步骤202,根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;步骤204,在所述预设的本体词汇库中查找出与所述目标词汇存在关联关系的多个词汇,以组成词汇集;步骤206,在预设的知识条目库中,查找与所述词汇集中的每个词汇相关联的目标知识条目,并在查找到所述目标知识条目时,提取出所述目标知识条目对应的条目内容;步骤208,对提取出的所有条目内容进行汇总,并根据所述词汇集中每个词汇和其他词汇之间的关联关系确定所述所有条目内容的排列顺序,以按照所述排列顺序对所述所有条目内容进行组合,生成知识文件。
在该技术方案中,从预设的本体词汇库中选择出目标词汇,通过目标词汇则可在本体词汇库中找到多个词汇,这样,根据多个词汇查找出与其关联的知识条目,通过各词汇之间的关系,确定各个知识条目的顺序,从而生成一个符合用户要求的知识文件。这样,不但降低了建立关联关系的成本,而且可以生成满足用户不同需求的知识文件,即快速生成面向某个主题的出版物,为用户提供更加个性化及精准的服务,提升用户的使用体验。
在上述技术方案中,优选地,还包括:根据接收到的关联命令,建立所述预设的本体词汇库中多个词汇之间的关联关系;根据接收到的关联命令,将所述本体词汇库中的词汇和知识条目库中的知识条目进行关联。
在该技术方案中,为本体词汇库中的多个词汇设置关联关系,并在本体词汇库中的词汇和知识条目库中的知识条目建立关联,这样,只要用户选择目标词汇,就可以在本体词汇库中找到与目标词汇关联的所有词汇,进而根据这些词汇找到对应的知识条目,将这些知识条目按照顺序组合,就可以生成知识文件。
在上述技术方案中,优选地,根据接收到的关联命令,将所述本体词汇库中的词汇和知识条目库中的知识条目进行关联,具体包括:对所述知识条目库中每个知识条目对应的条目内容进行解析,并获取每个条目内容对应的知识条目特征,其中,所述知识条目特征包括多个关键词;解析出所述知识条目特征中的多个关键词,将所述多个关键词中的每个关键词和所述预设的本体词汇库中的每个词汇进行比较,并根据比较结果确定与所述知识条目特征对应的词汇,以确定与所述知识条目关联的词汇。
在该技术方案中,当在本体词汇库中的词汇和知识条目库中的至少条目之间建立关联时,可以通过自动推荐和人工调节相配合的方式建立,其中自动推荐即解析知识条目中的关键词,并将解析出的关键词和本体词汇库中的词汇进行比较,从而为知识条目找到与其最匹配的词汇,从而推荐给用户,这样,用户不需要自己一一建立关联关系,降低了降低关联关系的成本。
在上述技术方案中,优选地,还包括:对所述知识文件、所述预设的本体词汇库中的词库和/或所述知识条目库中的知识条目进行显示。
在该技术方案中,用户可以直观地查看到知识文件,预设的本体词汇库和知识条目中的内容,这样,为用户提供可视化的界面,方便用户的操作。
在上述技术方案中,优选地,还包括:根据接收到的调整命令,对所述知识文件中的条目内容的排列顺序进行调整。
在该技术方案中,用户还可以对生成的知识文件中的条目内容的顺序进行调整,从而保证知识文件的准确性。
图3示出了根据本发明的实施例的知识重组系统的结构图。
如图3所示,根据本发明的实施例的知识重组系统300包括:
科教领域本体构建装置302:用于构建科教领域本体模型,包括领域词汇的构建、词汇类别的划分以及词汇关联关系的构建。
领域本体与知识条目关联装置304:用户构建领域本体与知识条目的关联关系,根据知识条目特征,把知识条目划分到某个本体下。
产品动态重组装置304:根据个性化需求,动态生成数字产品内容。
其中,科教领域本地构建装置302提供领域词汇批量导入和手工录入工具,实现领域词汇的快速录入。录入过程中自动与已经存在的领域词汇进行比较,判断是否已经存在,如果存在给予提示。再进一步,还可以对已经录入的领域词汇进行类别划分。再进一步,建立领域词汇之间的关联关系,包括上位关系、下位关系、同位关系等。
领域本体与知识条目关联装置304根据分词技术自动对知识条目进行分词,提取知识条目的关键特征。根据知识条目提取的关键特征,自动获取相似的本体词汇作为推荐。其可以提供可视化的页面显示知识条目、知识条目特征以及推荐的默认本体词汇,还可以提供本体词汇手工修正装置,使用户可以对知识条目的本体词汇进行调整。
产品动态重组装置306根据当前用户选择的本体词汇,获取本体词汇相关的知识条目展现给用户。产品动态重组装置306可以提供本体词汇选择,用户可以快速选择自己感兴趣的词汇,其可以根据用户选择的本体词汇获取与其密切关联的本体词汇,构成领域本体词汇表,继而根据领域本体词汇表,从条目索引库中获取条目ID集合,并根据条目ID集合获取条目内容,返回给页面供用户浏览。进一步第,产品动态重组装置306提供可视化的调整功能,用户调整完毕后,完成整个知识文件的内容重组。
图4示出了根据本发明的实施例的知识重组方法的具体流程图。
如图4所示,根据本发明的实施例的知识重组方法的具体流程如下:
步骤402,接收用户录入的科教领域词汇,其中用户可以采用词汇表批量导入以及手工创建的方式进行录入,从而建立科教领域词汇表,并对录入的词汇根据科教领域分类体系对词汇进行分类划分。
步骤404,建立领域词汇的关联关系:对录入的领域词汇设置关联关系,包括上位词、下位词、同位词等。
步骤406,提取知识条目的特征:依据分词技术,从知识条目的全文内容中提取知识条目的特征,每个知识条目特征由十个关键词组成。
步骤408,匹配相似领域词汇:用知识条目特征和领域词汇进行比较,形成相似领域词表作为推荐词汇集合。
步骤410,人工对条目的关联的领域词汇进行调整,确认最终标注的领域词汇。
步骤412,选择要获取的领域词汇:显示领域词汇,从领域词汇中选择自己要获取知识的领域。并根据所选领域词汇,从领域本体中获取相关度比较高的词汇作为领域词汇集合。
步骤414,获取知识条目,进行重组。根据领域词汇集合,从知识条目的存储索引中,获取符合领域词汇的知识条目ID集合,根据知识条目ID集合,获取知识条目内容,将获取的知识条目内容按照领域词汇的关联关系及类别进行分类重组,形成结构化的动态出版物,通过终端展示最终的动态出版物内容。
采用本发明的所述的动态重组方法,提升了动态重组的准确性,通过对知识条目进行本体词汇标引,建立起知识条目之间的关联关系,从而不仅降低了建立关联关系的成本,而且通过动态重组,可以快速生成面向某个主题的出版物,为用户提供更加个性化及精准的服务,提高平台的粘性。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,不但降低了建立关联关系的成本,而且可以生成满足用户不同需求的知识文件,即快速生成面向某个主题的出版物,为用户提供更加个性化及精准的服务,提升用户的使用体验。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种知识重组系统,其特征在于,包括:
选择单元,用于根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;
查找单元,连接至所述选择单元,用于在所述预设的本体词汇库中查找出与所述目标词汇存在关联关系的多个词汇,以组成词汇集,其中,所述关联关系包括上位关系,下位关系和同位关系;
提取单元,连接至所述查找单元,用于在预设的知识条目库中,查找与所述词汇集中的每个词汇相关联的目标知识条目,并在查找到所述目标知识条目时,提取出所述目标知识条目对应的条目内容;
文件生成单元,连接至所述提取单元,用于对所述提取单元提取出的所有条目内容进行汇总,并根据所述词汇集中每个词汇和其他词汇之间的关联关系确定所述所有条目内容的排列顺序,以按照所述排列顺序对所述所有条目内容进行组合,生成知识文件。
2.根据权利要求1所述的知识重组系统,其特征在于,还包括:
第一关联单元,连接至所述查找单元,用于根据接收到的关联命令,建立所述预设的本体词汇库中多个词汇之间的关联关系;
第二关联单元,连接至所述提取单元,用于根据接收到的关联命令,将所述预设的本体词汇库中的词汇和知识条目库中的知识条目进行关联。
3.根据权利要求2所述的知识重组系统,其特征在于,所述第二关联单元包括:
关键词提取单元,用于对所述知识条目库中每个知识条目对应的条目内容进行解析,并获取每个条目内容对应的知识条目特征,其中,所述知识条目特征包括多个关键词;
确定单元,用于解析出所述知识条目特征中的多个关键词,将所述多个关键词中的每个关键词和所述预设的本体词汇库中的每个词汇进行比较,并根据比较结果确定与所述知识条目特征对应的词汇,以确定与所述知识条目关联的词汇。
4.根据权利要求1至3中任一项所述的知识重组系统,其特征在于,还包括:
显示单元,连接至所述选择单元和所述文件生成单元,用于对所述知识文件、所述预设的本体词汇库中的词库和/或所述知识条目库中的知识条目进行显示。
5.根据权利要求4所述的知识重组系统,其特征在于,还包括:
重组单元,连接至所述显示单元,用于根据接收到的调整命令,对所述知识文件中的条目内容的排列顺序进行调整。
6.一种知识重组方法,其特征在于,包括:
根据接收到的选择命令,从预设的本体词汇库中选择出目标词汇;
在所述预设的本体词汇库中查找出与所述目标词汇存在关联关系的多个词汇,以组成词汇集,其中,所述关联关系包括上位关系,下位关系和同位关系;
在预设的知识条目库中,查找与所述词汇集中的每个词汇相关联的目标知识条目,并在查找到所述目标知识条目时,提取出所述目标知识条目对应的条目内容;
对提取出的所有条目内容进行汇总,并根据所述词汇集中每个词汇和其他词汇之间的关联关系确定所述所有条目内容的排列顺序,以按照所述排列顺序对所述所有条目内容进行组合,生成知识文件。
7.根据权利要求6所述的知识重组方法,其特征在于,还包括:
根据接收到的关联命令,建立所述预设的本体词汇库中多个词汇之间的关联关系;
根据接收到的关联命令,将所述本体词汇库中的词汇和知识条目库中的知识条目进行关联。
8.根据权利要求7所述的知识重组方法,其特征在于,根据接收到的关联命令,将所述本体词汇库中的词汇和知识条目库中的知识条目进行关联,具体包括:
对所述知识条目库中每个知识条目对应的条目内容进行解析,并获取每个条目内容对应的知识条目特征,其中,所述知识条目特征包括多个关键词;
解析出所述知识条目特征中的多个关键词,将所述多个关键词中的每个关键词和所述预设的本体词汇库中的每个词汇进行比较,并根据比较结果确定与所述知识条目特征对应的词汇,以确定与所述知识条目关联的词汇。
9.根据权利要求6至8中任一项所述的知识重组方法,其特征在于,还包括:
对所述知识文件、所述预设的本体词汇库中的词库和/或所述知识条目库中的知识条目进行显示。
10.根据权利要求9所述的知识重组方法,其特征在于,还包括:
根据接收到的调整命令,对所述知识文件中的条目内容的排列顺序进行调整。
CN201410119484.1A 2014-03-27 2014-03-27 知识重组系统和知识重组方法 Expired - Fee Related CN103927339B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410119484.1A CN103927339B (zh) 2014-03-27 2014-03-27 知识重组系统和知识重组方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410119484.1A CN103927339B (zh) 2014-03-27 2014-03-27 知识重组系统和知识重组方法

Publications (2)

Publication Number Publication Date
CN103927339A CN103927339A (zh) 2014-07-16
CN103927339B true CN103927339B (zh) 2017-10-31

Family

ID=51145560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410119484.1A Expired - Fee Related CN103927339B (zh) 2014-03-27 2014-03-27 知识重组系统和知识重组方法

Country Status (1)

Country Link
CN (1) CN103927339B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109074353B (zh) * 2016-10-10 2022-11-08 微软技术许可有限责任公司 用于信息检索的方法、装置和系统
CN110458666A (zh) * 2019-08-09 2019-11-15 同方知网(北京)技术有限公司 一种基于领域知识的个性化知识库重组方法
CN110472217A (zh) * 2019-08-20 2019-11-19 同方知网(北京)技术有限公司 一种基于重组策略的内容动态重组方法
CN110472218A (zh) * 2019-08-20 2019-11-19 同方知网(北京)技术有限公司 一种面向重组策略的并行执行方法
CN110930408B (zh) * 2019-10-15 2021-06-18 浙江大学 基于知识重组的语义图像压缩方法
CN113407668B (zh) * 2021-06-11 2022-10-11 武夷学院 一种针对认知关联能力训练的数据处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1380620A (zh) * 2001-12-18 2002-11-20 张弦 图书索引自动编排方法
CN101013421A (zh) * 2007-02-02 2007-08-08 清华大学 基于规则的汉语基本块自动分析方法
CN102402619A (zh) * 2011-12-23 2012-04-04 广东威创视讯科技股份有限公司 一种搜索方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070100915A1 (en) * 2005-10-31 2007-05-03 Rose Daniel E Methods for displaying dynamic suggestions in a user interface

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1380620A (zh) * 2001-12-18 2002-11-20 张弦 图书索引自动编排方法
CN101013421A (zh) * 2007-02-02 2007-08-08 清华大学 基于规则的汉语基本块自动分析方法
CN102402619A (zh) * 2011-12-23 2012-04-04 广东威创视讯科技股份有限公司 一种搜索方法和装置

Also Published As

Publication number Publication date
CN103927339A (zh) 2014-07-16

Similar Documents

Publication Publication Date Title
CN110188168B (zh) 语义关系识别方法和装置
CN103927339B (zh) 知识重组系统和知识重组方法
CN106776711B (zh) 一种基于深度学习的中文医学知识图谱构建方法
US10120861B2 (en) Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
CN103593425B (zh) 基于偏好的智能检索方法及系统
CN102968465B (zh) 网络信息服务平台及其基于该平台的搜索服务方法
CN109710935B (zh) 一种基于文物知识图谱的博物馆导览与知识推荐方法
CN109582800B (zh) 一种训练结构化模型、文本结构化的方法及相关装置
CN107220295A (zh) 一种人民矛盾调解案例搜索和调解策略推荐方法
CN101639857B (zh) 构建知识问答分享平台的方法、装置及系统
CN103020066B (zh) 一种识别搜索需求的方法和装置
CN105843850B (zh) 搜索优化方法和装置
CN102663129A (zh) 医疗领域深度问答方法及医学检索系统
CN106204156A (zh) 一种用于网络论坛的广告投放方法及装置
CN107665217A (zh) 一种用于搜索业务的词汇处理方法及系统
CN103605665A (zh) 一种基于关键词的评审专家智能检索与推荐方法
CN103389988A (zh) 一种引导用户进行信息搜索的方法及装置
CN102129477B (zh) 一种多模态联合的图像重排序方法
CN112559684A (zh) 一种关键词提取及信息检索方法
US20140379719A1 (en) System and method for tagging and searching documents
CN102955848A (zh) 一种基于语义的三维模型检索系统和方法
CN105630940B (zh) 一种基于可读性指标的信息检索方法
CN109582933B (zh) 一种确定文本新颖度的方法及相关装置
CN102999489A (zh) 一种社区网站页面的图片检索方法和系统
CN109635277B (zh) 一种获取实体信息的方法及相关装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220615

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171031

CF01 Termination of patent right due to non-payment of annual fee