CN110019828B - 基于知识图谱的参见落实校验方法及系统 - Google Patents

基于知识图谱的参见落实校验方法及系统 Download PDF

Info

Publication number
CN110019828B
CN110019828B CN201710823786.0A CN201710823786A CN110019828B CN 110019828 B CN110019828 B CN 110019828B CN 201710823786 A CN201710823786 A CN 201710823786A CN 110019828 B CN110019828 B CN 110019828B
Authority
CN
China
Prior art keywords
items
knowledge
implementation
attributes
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710823786.0A
Other languages
English (en)
Other versions
CN110019828A (zh
Inventor
李肖冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Original Assignee
New Founder Holdings Development Co ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Founder Holdings Development Co ltd, Beijing Founder Electronics Co Ltd filed Critical New Founder Holdings Development Co ltd
Priority to CN201710823786.0A priority Critical patent/CN110019828B/zh
Publication of CN110019828A publication Critical patent/CN110019828A/zh
Application granted granted Critical
Publication of CN110019828B publication Critical patent/CN110019828B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的参见落实校验方法及系统。其中,一种基于知识图谱的参见落实校验方法,包括:提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;分析条目的类型和参见落实的情况,获取参见落实规则;导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。

Description

基于知识图谱的参见落实校验方法及系统
技术领域
本发明涉及工具书的编纂技术领域,具体而言,涉及一种基于知识图谱的参见落实校验方法,一种基于知识图谱的参见落实校验系统,一种计算机设备,一种计算机可读存储介质。
背景技术
在工具书的编纂领域,参见落实工作需要人工查核,即编辑在处理稿件或读校样时,需要花费大量时间处理释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等参见落实的情况,人工找到参见条目后进行核查,不仅花费时间还会造成疏漏,导致出现参见落空、参见不对应、呼应有错误、分别使用简称和全称造成差错等一系列状况。
因此,如何提供一种基于知识图谱的参见条目检索方法,可以很大程度上提高编辑校验参见条目的效率与准确性,成为目前亟待解决的技术问题。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一方面在于提出了一种基于知识图谱的参见落实校验方法。
本发明的另一方面在于提出了一种基于知识图谱的参见落实校验系统。
本发明的又一方面在于提出了一种计算机设备。
本发明的再一方面在于提出了一种计算机可读存储介质。
有鉴于此,本发明提出了一种基于知识图谱的参见落实校验方法,包括:提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;分析条目的类型和参见落实的情况,获取参见落实规则;导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
根据本发明的基于知识图谱的参见落实校验方法,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
另外,根据本发明上述的基于知识图谱的参见落实校验方法,还可以具有如下附加的技术特征:
在上述技术方案中,优选地,分析条目的类型和参见落实的情况,获取参见落实规则的步骤,具体包括:分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括以下任一项或其组合:人物、地名、官职、思想学派、作品;参见词包括以下任一项或其组合:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
在该技术方案中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括但不限于以下任一项或其组合:人物、地名、官职、思想学派、作品,对于不同项目或不同领域的条目可以具体分析其类型。
在上述任一技术方案中,优选地,该参见落实校验方法还包括:将参见条目列表及参见关系图谱进行显示。
在该技术方案中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
在上述任一技术方案中,优选地,该参见落实校验方法还包括:分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充。
在该技术方案中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
其中,本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,例如,人物模型的属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一技术方案中,优选地,参见关系包括正向关系、逆向关系。
在该技术方案中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
本发明还提出了一种基于知识图谱的参见落实校验系统,包括:知识模型构建单元,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;获取单元,用于分析条目的类型和参见落实的情况,获取参见落实规则;分类单元,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;图谱构建单元,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
根据本发明的基于知识图谱的参见落实校验系统,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
在上述技术方案中,优选地,获取单元,具体用于:分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括以下任一项或其组合:人物、地名、官职、思想学派、作品;参见词包括以下任一项或其组合:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
在该技术方案中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括但不限于以下任一项或其组合:人物、地名、官职、思想学派、作品,对于不同项目或不同领域的条目可以具体分析其类型。
在上述任一技术方案中,优选地,该参见落实校验系统还包括:显示单元,用于将参见条目列表及参见关系图谱进行显示。
在该技术方案中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
在上述任一技术方案中,优选地,分类单元,还用于分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充。
在该技术方案中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
其中,本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,例如,人物模型的属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一技术方案中,优选地,参见关系包括正向关系、逆向关系。
在该技术方案中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器用于执行如上述技术方案中任一项方法的步骤。
根据本发明的计算机设备,其所包含的处理器用于执行如上述任一技术方案中基于知识图谱的参见落实校验方法的步骤,因而该计算机设备能够实现该基于知识图谱的参见落实校验方法的全部有益效果,在此不再赘述。
本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如上述技术方案中任一项方法的步骤。
根据本发明的计算机可读存储介质,其上存储的计算机程序被处理器执行时实现了如上述任一技术方案中基于知识图谱的参见落实校验方法的步骤,因而该计算机可读存储介质能够实现该基于知识图谱的参见落实校验方法的全部有益效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了根据本发明的一个实施例的基于知识图谱的参见落实校验方法的流程示意图;
图2示出了根据本发明的另一个实施例的基于知识图谱的参见落实校验方法的流程示意图;
图3示出了根据本发明的再一个实施例的基于知识图谱的参见落实校验方法的流程示意图;
图4示出了根据本发明的一个实施例的基于知识图谱的参见落实校验系统的示意图;
图5示出了根据本发明的另一个实施例的基于知识图谱的参见落实校验系统的示意图;
图6示出了根据本发明的再一个实施例的基于知识图谱的参见落实校验系统的示意图;
图7示出了根据本发明的一个具体实施例的基于知识图谱的参见落实校验方法的流程示意图;
图8示出了根据本发明的一个实施例的知识元模型界面的示意图;
图9示出了根据本发明的一个实施例的模型关系界面的示意图;
图10示出了根据本发明的一个实施例的参见落实界面的示意图;
图11示出了根据本发明的一个实施例的计算机设备的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,根据本发明的一个实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该参见落实校验方法包括:
步骤102,提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
步骤104,分析条目的类型和参见落实的情况,获取参见落实规则;
步骤106,导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
步骤108,在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
本发明提供的基于知识图谱的参见落实校验方法,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
如图2所示,根据本发明的另一个实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该参见落实校验方法包括:
步骤202,提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
步骤204,分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括:人物、地名、官职、思想学派、作品;参见词包括:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图;
步骤206,导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
步骤208,在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
在该实施例中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括多种,对于不同项目或不同领域的条目可以具体分析其类型,在此,仅以人物、地名、官职、思想学派、作品为例,但不限于此。
如图3所示,根据本发明的再一个实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该参见落实校验方法包括:
步骤302,提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
步骤304,分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括:人物、地名、官职、思想学派、作品;参见词包括:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图;
步骤306,导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
步骤308,分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充;
其中,属性包括:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见;
步骤310,在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱;
步骤312,将参见条目列表及参见关系图谱进行显示。
在该实施例中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
在该实施例中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
其中,本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,在此,仅以人物模型的属性为例,该属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一实施例中,优选地,参见关系包括正向关系、逆向关系。
在该实施例中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
如图4所示,根据本发明的一个实施例的基于知识图谱的参见落实校验系统的示意框图。其中,该参见落实校验系统包括:
知识模型构建单元402,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
获取单元404,用于分析条目的类型和参见落实的情况,获取参见落实规则;
第一分类单元406,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
图谱构建单元408,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
本发明提供的基于知识图谱的参见落实校验系统,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
在上述实施例中,优选地,获取单元404,具体用于:分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括:人物、地名、官职、思想学派、作品;参见词包括:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
在该实施例中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括多种,对于不同项目或不同领域的条目可以具体分析其类型,在此,仅以人物、地名、官职、思想学派、作品为例,但不限于此。
如图5所示,根据本发明的另一个实施例的基于知识图谱的参见落实校验系统的示意框图。其中,该参见落实校验系统包括:
知识模型构建单元502,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
获取单元504,用于分析条目的类型和参见落实的情况,获取参见落实规则;
第一分类单元506,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
图谱构建单元508,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱;
显示单元510,用于将参见条目列表及参见关系图谱进行显示。
在该实施例中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
如图6所示,根据本发明的再一个实施例的基于知识图谱的参见落实校验系统的示意框图。其中,该参见落实校验系统包括:
知识模型构建单元602,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
获取单元604,用于分析条目的类型和参见落实的情况,获取参见落实规则;
第一分类单元606,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
第二分类单元608,用于分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充;其中,属性包括以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见;
图谱构建单元610,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱;
显示单元612,用于将参见条目列表及参见关系图谱进行显示。
在该实施例中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,在此,仅以人物模型的属性为例,该属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一实施例中,优选地,参见关系包括正向关系、逆向关系。
在该实施例中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
如图7所示,根据本发明的一个具体实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该方法包括:
步骤702,提取条目的类型及其属性特征,包含“参见”属性,建立知识元模型,并设置模型的参见关系;
具体地,通过对工具书条目类型及类型属性(包含“参见”属性)的整理归纳,建立知识元模型,知识元模型界面如图8所示;设置不同模型见的关系,必须设置所有模型的参见关系以及其他属性关系,模型关系界面如图9所示;
步骤704,分析条目类型和参见落实的情况,设计所有属性的提取算法;
具体地,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法;分析不同条目类型的属性特征,设计出除“参见”属性外的其他属性的提取算法;
步骤706,导入条目,根据提取规则,自动解析释文,填充条目属性;
具体地,导入工具书所有条目,自动解析条目释文,进行条目归类以及属性的自动填充,需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性;
步骤708,依据属性特征建立起直观的参见关系图谱;
具体地,属性提取完毕后,系统将根据建立的知识元模型以及设置的模型参见关系,自动构建起起参见关系图谱,其中其他属性关系图谱作为参见落实的辅助参考;
步骤710,将参见条目列表及构建起来的参见关系图谱,显示出来;
具体地,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性,参见落实界面如图10所示。
在该实施例中,提供了一种基于知识图谱的参见条目检索方法,使编辑在工具书参见落实的校验环节,通过参见关系图谱和参见条目列表,对参见落实情况有一个直观的把握,可以很大程度上提高编辑校验参见条目的效率。
如图11所示,根据本发明的一个实施例的计算机设备的示意图。该计算机设备1包括存储器12、处理器14及存储在存储器12上并可在处理器14上运行的计算机程序,处理器14用于执行如上述任一实施例中基于知识图谱的参见落实校验方法的步骤。
本发明提供的计算机设备1,其所包含的处理器14用于执行如上述任一实施例中基于知识图谱的参见落实校验方法的步骤,因而该计算机设备1能够实现该基于知识图谱的参见落实校验方法全部的有益效果,在此不再赘述。
本发明的另一方面实施例,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如基于知识图谱的参见落实校验方法的步骤。
本发明提供的计算机可读存储介质,其上存储的计算机程序被处理器执行时实现了如上述任一实施例中基于知识图谱的参见落实校验方法的步骤,因而该计算机可读存储介质能够实现该基于知识图谱的参见落实校验方法全部的有益效果,在此不再赘述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于知识图谱的参见落实校验方法,其特征在于,包括:
提取工具书所有条目的类型及其属性,建立知识模型,并设置各所述知识模型间的参见关系;
分析所述条目的类型和参见落实的情况,获取参见落实规则;
导入所述工具书的所有条目,根据所述参见落实规则提取参见条目,将所述参见条目存储至参见属性中;
在属性提取完毕后,根据所述知识模型及所述参见关系建立参见关系图谱;
所述分析所述条目的类型和参见落实的情况,获取参见落实规则的步骤,具体包括:
分析所述条目的类型及所述参见落实中包含的参见词及其对应的规律,获取所述参见落实规则。
2.根据权利要求1所述的基于知识图谱的参见落实校验方法,其特征在于,
所述类型包括以下任一项或其组合:人物、地名、官职、思想学派、作品;
所述参见词包括以下任一项或其组合:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
3.根据权利要求1所述的基于知识图谱的参见落实校验方法,其特征在于,还包括:
将参见条目列表及所述参见关系图谱进行显示。
4.根据权利要求1至3中任一项所述的基于知识图谱的参见落实校验方法,其特征在于,还包括:
分析所述条目的类型及其属性,获取所述参见属性以外的其它属性的提取规则,根据所述其它属性的提取规则进行所述参见条目以外的其它条目的归类及属性填充。
5.根据权利要求4所述的基于知识图谱的参见落实校验方法,其特征在于,
所述参见关系包括正向关系、逆向关系。
6.一种基于知识图谱的参见落实校验系统,其特征在于,包括:
知识模型构建单元,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各所述知识模型间的参见关系;
获取单元,用于分析所述条目的类型和参见落实的情况,获取参见落实规则;
分类单元,用于导入所述工具书的所有条目,根据所述参见落实规则提取参见条目,将所述参见条目存储至参见属性中;
图谱构建单元,用于在属性提取完毕后,根据所述知识模型及所述参见关系建立参见关系图谱;
所述获取单元,具体用于:
分析所述条目的类型及所述参见落实中包含的参见词及其对应的规律,获取所述参见落实规则。
7.根据权利要求6所述的基于知识图谱的参见落实校验系统,其特征在于,
所述类型包括以下任一项或其组合:人物、地名、官职、思想学派、作品;
所述参见词包括以下任一项或其组合:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
8.根据权利要求6所述的基于知识图谱的参见落实校验系统,其特征在于,还包括:
显示单元,用于将参见条目列表及所述参见关系图谱进行显示。
9.根据权利要求6至8中任一项所述的基于知识图谱的参见落实校验系统,其特征在于,还包括:
第二分类单元,用于分析所述条目的类型及其属性,获取所述参见属性以外的其它属性的提取规则,根据所述其它属性的提取规则进行所述参见条目以外的其它条目的归类及属性填充。
10.根据权利要求9所述的基于知识图谱的参见落实校验系统,其特征在于,
所述参见关系包括正向关系、逆向关系。
11.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器用于执行如权利要求1至5中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现了如权利要求1至5中任一项所述方法的步骤。
CN201710823786.0A 2017-09-13 2017-09-13 基于知识图谱的参见落实校验方法及系统 Active CN110019828B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710823786.0A CN110019828B (zh) 2017-09-13 2017-09-13 基于知识图谱的参见落实校验方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710823786.0A CN110019828B (zh) 2017-09-13 2017-09-13 基于知识图谱的参见落实校验方法及系统

Publications (2)

Publication Number Publication Date
CN110019828A CN110019828A (zh) 2019-07-16
CN110019828B true CN110019828B (zh) 2023-06-30

Family

ID=67186270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710823786.0A Active CN110019828B (zh) 2017-09-13 2017-09-13 基于知识图谱的参见落实校验方法及系统

Country Status (1)

Country Link
CN (1) CN110019828B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505570B (zh) * 2021-05-25 2024-04-12 北京北大方正电子有限公司 参考文献参见落空的审校方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048500A (ja) * 2007-08-21 2009-03-05 Chugoku Electric Power Co Inc:The 注記表作成支援装置及びシステム
CN101714199A (zh) * 2009-12-14 2010-05-26 陈发勇 互联网虚拟纸张认证系统
CN101917554A (zh) * 2009-12-30 2010-12-15 新奥特(北京)视频技术有限公司 一种广告节目单的自动校验方法和广告节目单编排方法
KR20120132716A (ko) * 2011-05-30 2012-12-10 주식회사 크레듀 소셜 네트워크 서비스를 이용한 협력 학습 시스템
CN105574098A (zh) * 2015-12-11 2016-05-11 百度在线网络技术(北京)有限公司 知识图谱的生成方法及装置、实体对比方法及装置
CN105760976A (zh) * 2014-12-17 2016-07-13 阿里巴巴集团控股有限公司 一种业务校验方法和系统
CN106991045A (zh) * 2017-03-24 2017-07-28 广州酷狗计算机科技有限公司 页面校验方法及装置
CN107016068A (zh) * 2017-03-21 2017-08-04 深圳前海乘方互联网金融服务有限公司 知识图谱构建方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003227310A1 (en) * 2002-04-05 2003-10-20 Lisa Seeman Networked accessibility enhancer system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048500A (ja) * 2007-08-21 2009-03-05 Chugoku Electric Power Co Inc:The 注記表作成支援装置及びシステム
CN101714199A (zh) * 2009-12-14 2010-05-26 陈发勇 互联网虚拟纸张认证系统
CN101917554A (zh) * 2009-12-30 2010-12-15 新奥特(北京)视频技术有限公司 一种广告节目单的自动校验方法和广告节目单编排方法
KR20120132716A (ko) * 2011-05-30 2012-12-10 주식회사 크레듀 소셜 네트워크 서비스를 이용한 협력 학습 시스템
CN105760976A (zh) * 2014-12-17 2016-07-13 阿里巴巴集团控股有限公司 一种业务校验方法和系统
CN105574098A (zh) * 2015-12-11 2016-05-11 百度在线网络技术(北京)有限公司 知识图谱的生成方法及装置、实体对比方法及装置
CN107016068A (zh) * 2017-03-21 2017-08-04 深圳前海乘方互联网金融服务有限公司 知识图谱构建方法及装置
CN106991045A (zh) * 2017-03-24 2017-07-28 广州酷狗计算机科技有限公司 页面校验方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于多种数据源的中文知识图谱构建方法研究;胡芳槐;《中国博士学位论文全文数据库》;全文 *

Also Published As

Publication number Publication date
CN110019828A (zh) 2019-07-16

Similar Documents

Publication Publication Date Title
CN108304382B (zh) 基于制造过程文本数据挖掘的质量分析方法与系统
CN111259160A (zh) 知识图谱构建方法、装置、设备及存储介质
EP3617910A1 (en) Method and apparatus for displaying textual information
CN113379398B (zh) 一种项目需求的生成方法、装置、电子设备及存储介质
WO2021042507A1 (zh) pdf文档中表格数据的提取方法、设备和存储介质
CN112036153A (zh) 工单纠错方法、装置、计算机可读存储介质和计算机设备
CN102855276A (zh) 一种判定评论文本极性的方法及其应用
CN108984597A (zh) 一种船舶产品结构树的构建方法及系统
CN114201615B (zh) 基于数据快照的科研数据变动回顾方法及服务器
CN110019828B (zh) 基于知识图谱的参见落实校验方法及系统
CN106407288A (zh) 一种信息同步更新的方法及系统
CN114676231A (zh) 一种目标信息检测方法、设备和介质
CN114462383B (zh) 建筑图纸设计说明书获取方法、系统、存储介质及设备
CN107203525B (zh) 数据库的处理方法和装置
CN109670183A (zh) 一种文本重要性的计算方法、装置、设备和存储介质
CN107015955B (zh) 文档编辑方法和装置
CN114035783A (zh) 一种软件代码知识图谱构建方法及工具
CN114706886A (zh) 一种评测方法和装置、计算机设备、存储介质
US20210318949A1 (en) Method for checking file data, computer device and readable storage medium
KR102118322B1 (ko) 원문과 번역문 파일을 개별적으로 생성하는 문서 번역 서버 및 번역 방법
CN114328495A (zh) 企业物料清洗服务系统及其数据清洗方法
CN108170838B (zh) 话题演变的可视化展现方法、应用服务器及计算机可读存储介质
CN112559773A (zh) 一种知识图谱系统搭建方法及装置
JP5277185B2 (ja) 情報処理システム
KR101698422B1 (ko) Iwod를 사용한 프로세스 맵 설계 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230609

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Applicant after: New founder holdings development Co.,Ltd.

Applicant after: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

Address before: 100871, Beijing, Haidian District Cheng Fu Road 298, founder building, 9 floor

Applicant before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Applicant before: BEIJING FOUNDER ELECTRONICS Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant