发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一方面在于提出了一种基于知识图谱的参见落实校验方法。
本发明的另一方面在于提出了一种基于知识图谱的参见落实校验系统。
本发明的又一方面在于提出了一种计算机设备。
本发明的再一方面在于提出了一种计算机可读存储介质。
有鉴于此,本发明提出了一种基于知识图谱的参见落实校验方法,包括:提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;分析条目的类型和参见落实的情况,获取参见落实规则;导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
根据本发明的基于知识图谱的参见落实校验方法,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
另外,根据本发明上述的基于知识图谱的参见落实校验方法,还可以具有如下附加的技术特征:
在上述技术方案中,优选地,分析条目的类型和参见落实的情况,获取参见落实规则的步骤,具体包括:分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括以下任一项或其组合:人物、地名、官职、思想学派、作品;参见词包括以下任一项或其组合:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
在该技术方案中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括但不限于以下任一项或其组合:人物、地名、官职、思想学派、作品,对于不同项目或不同领域的条目可以具体分析其类型。
在上述任一技术方案中,优选地,该参见落实校验方法还包括:将参见条目列表及参见关系图谱进行显示。
在该技术方案中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
在上述任一技术方案中,优选地,该参见落实校验方法还包括:分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充。
在该技术方案中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
其中,本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,例如,人物模型的属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一技术方案中,优选地,参见关系包括正向关系、逆向关系。
在该技术方案中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
本发明还提出了一种基于知识图谱的参见落实校验系统,包括:知识模型构建单元,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;获取单元,用于分析条目的类型和参见落实的情况,获取参见落实规则;分类单元,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;图谱构建单元,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
根据本发明的基于知识图谱的参见落实校验系统,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
在上述技术方案中,优选地,获取单元,具体用于:分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括以下任一项或其组合:人物、地名、官职、思想学派、作品;参见词包括以下任一项或其组合:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
在该技术方案中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括但不限于以下任一项或其组合:人物、地名、官职、思想学派、作品,对于不同项目或不同领域的条目可以具体分析其类型。
在上述任一技术方案中,优选地,该参见落实校验系统还包括:显示单元,用于将参见条目列表及参见关系图谱进行显示。
在该技术方案中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
在上述任一技术方案中,优选地,分类单元,还用于分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充。
在该技术方案中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
其中,本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,例如,人物模型的属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一技术方案中,优选地,参见关系包括正向关系、逆向关系。
在该技术方案中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器用于执行如上述技术方案中任一项方法的步骤。
根据本发明的计算机设备,其所包含的处理器用于执行如上述任一技术方案中基于知识图谱的参见落实校验方法的步骤,因而该计算机设备能够实现该基于知识图谱的参见落实校验方法的全部有益效果,在此不再赘述。
本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如上述技术方案中任一项方法的步骤。
根据本发明的计算机可读存储介质,其上存储的计算机程序被处理器执行时实现了如上述任一技术方案中基于知识图谱的参见落实校验方法的步骤,因而该计算机可读存储介质能够实现该基于知识图谱的参见落实校验方法的全部有益效果,在此不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,根据本发明的一个实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该参见落实校验方法包括:
步骤102,提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
步骤104,分析条目的类型和参见落实的情况,获取参见落实规则;
步骤106,导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
步骤108,在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
本发明提供的基于知识图谱的参见落实校验方法,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
如图2所示,根据本发明的另一个实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该参见落实校验方法包括:
步骤202,提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
步骤204,分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括:人物、地名、官职、思想学派、作品;参见词包括:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图;
步骤206,导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
步骤208,在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
在该实施例中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括多种,对于不同项目或不同领域的条目可以具体分析其类型,在此,仅以人物、地名、官职、思想学派、作品为例,但不限于此。
如图3所示,根据本发明的再一个实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该参见落实校验方法包括:
步骤302,提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
步骤304,分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括:人物、地名、官职、思想学派、作品;参见词包括:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图;
步骤306,导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
步骤308,分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充;
其中,属性包括:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见;
步骤310,在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱;
步骤312,将参见条目列表及参见关系图谱进行显示。
在该实施例中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
在该实施例中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
其中,本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,在此,仅以人物模型的属性为例,该属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一实施例中,优选地,参见关系包括正向关系、逆向关系。
在该实施例中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
如图4所示,根据本发明的一个实施例的基于知识图谱的参见落实校验系统的示意框图。其中,该参见落实校验系统包括:
知识模型构建单元402,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
获取单元404,用于分析条目的类型和参见落实的情况,获取参见落实规则;
第一分类单元406,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
图谱构建单元408,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱。
本发明提供的基于知识图谱的参见落实校验系统,通过对工具书条目类型及其属性的整理归纳,构建知识模型并设置不同知识模型间的参见关系,进而提取参见落实规则,将释文中参见的条目存储至参见属性中,根据属性特征建立起直观的参见关系图谱,最终将参见条目列表及构建起来的参见关系图谱显示出来。通过本发明的方法,能直观地提供参见条目列表和参见关系图谱,减少人工查找时间,降低出错率,提高校验参见条目的效率与准确性,给编辑工具书的参见落实校验环节提供了良好的工具。
在上述实施例中,优选地,获取单元404,具体用于:分析条目的类型及参见落实中包含的参见词及其对应的规律,获取参见落实规则;其中,类型包括:人物、地名、官职、思想学派、作品;参见词包括:释文中带*号的词语、条目无释文需要参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图。
在该实施例中,通过分析条目类型和参见落实的情况,设计参见属性(即参见落实规则)的提取算法。具体而言,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”、见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法。这样就可以提取工具书所有条目的属性特征,尤其是参见属性特征,属性提取完毕后,根据属性特征、建立的知识模型以及设置的模型参见关系,建立起一套直观的知识关系图谱,根据构建起来的参见关系图谱,编辑可以很容易的发现相关的参见条目,从而大大减少了人工寻找参见条目的时间。
本领域技术人员应该理解,条目类型(也即模型类型)包括多种,对于不同项目或不同领域的条目可以具体分析其类型,在此,仅以人物、地名、官职、思想学派、作品为例,但不限于此。
如图5所示,根据本发明的另一个实施例的基于知识图谱的参见落实校验系统的示意框图。其中,该参见落实校验系统包括:
知识模型构建单元502,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
获取单元504,用于分析条目的类型和参见落实的情况,获取参见落实规则;
第一分类单元506,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
图谱构建单元508,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱;
显示单元510,用于将参见条目列表及参见关系图谱进行显示。
在该实施例中,将参见条目列表及构建起来的参见关系图谱,显示出来,减少了人工寻找参见条目的时间。具体而言,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性。
如图6所示,根据本发明的再一个实施例的基于知识图谱的参见落实校验系统的示意框图。其中,该参见落实校验系统包括:
知识模型构建单元602,用于提取工具书所有条目的类型及其属性,建立知识模型,并设置各知识模型间的参见关系;
获取单元604,用于分析条目的类型和参见落实的情况,获取参见落实规则;
第一分类单元606,用于导入工具书的所有条目,根据参见落实规则提取参见条目,将参见条目存储至参见属性中;
第二分类单元608,用于分析条目的类型及其属性,获取参见属性以外的其它属性的提取规则,根据其它属性的提取规则进行参见条目以外的其它条目的归类及属性填充;其中,属性包括以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见;
图谱构建单元610,用于在属性提取完毕后,根据知识模型及参见关系建立参见关系图谱;
显示单元612,用于将参见条目列表及参见关系图谱进行显示。
在该实施例中,分析不同条目类型的属性特征,设计出除参见属性外的其他属性的提取算法。导入工具书的所有条目,根据参见落实规则以及该其他属性的提取规则,自动解析条目释文,进行条目归类以及属性的自动填充,其中,其他属性关系图谱作为参见落实的辅助参考。需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性。
本领域技术人员应该理解,模型类型具有多样,每个类型的属性都不同,在此,仅以人物模型的属性为例,该属性包括但不限于以下任一项或其组合:姓名、字、号、别称、谥号、年代、定性语、关联作品、关联人物、关联学说、参见。
在上述任一实施例中,优选地,参见关系包括正向关系、逆向关系。
在该实施例中,本领域技术人员应该理解,参见关系包括但不限于正向关系、逆向关系。参见关系表现了不同知识模型间的联系,不同形式的参见关系能够把被分割开的模型串联起来,从而最大限度地确保知识间的相互联接,从而大大减少了人工寻找参见条目的时间,进而提高校验参见条目的效率与准确性。
如图7所示,根据本发明的一个具体实施例的基于知识图谱的参见落实校验方法的流程示意图。其中,该方法包括:
步骤702,提取条目的类型及其属性特征,包含“参见”属性,建立知识元模型,并设置模型的参见关系;
具体地,通过对工具书条目类型及类型属性(包含“参见”属性)的整理归纳,建立知识元模型,知识元模型界面如图8所示;设置不同模型见的关系,必须设置所有模型的参见关系以及其他属性关系,模型关系界面如图9所示;
步骤704,分析条目类型和参见落实的情况,设计所有属性的提取算法;
具体地,分析参见落实包含的释文中带*号的词语、词目无释文而需要直接参见他条、详细内容需要参见他条、有对称关系的条目、有从属关系的条目、同类条目、参见插图等情况,总结出出现的所有参见词(如:即“*”见“*”、参见“**”等)以及对应的规律,最终写出参见条目的提取算法;分析不同条目类型的属性特征,设计出除“参见”属性外的其他属性的提取算法;
步骤706,导入条目,根据提取规则,自动解析释文,填充条目属性;
具体地,导入工具书所有条目,自动解析条目释文,进行条目归类以及属性的自动填充,需要特别注意的是,需保证参见词后的参见条目的条头的提取的完整性;
步骤708,依据属性特征建立起直观的参见关系图谱;
具体地,属性提取完毕后,系统将根据建立的知识元模型以及设置的模型参见关系,自动构建起起参见关系图谱,其中其他属性关系图谱作为参见落实的辅助参考;
步骤710,将参见条目列表及构建起来的参见关系图谱,显示出来;
具体地,终端页面将直观的展示具有参见关系条目的列表、条目释文、条目对应的参见关系图谱、参见条目信息以及错误的参见信息,提高编辑的校验效率与准确性,参见落实界面如图10所示。
在该实施例中,提供了一种基于知识图谱的参见条目检索方法,使编辑在工具书参见落实的校验环节,通过参见关系图谱和参见条目列表,对参见落实情况有一个直观的把握,可以很大程度上提高编辑校验参见条目的效率。
如图11所示,根据本发明的一个实施例的计算机设备的示意图。该计算机设备1包括存储器12、处理器14及存储在存储器12上并可在处理器14上运行的计算机程序,处理器14用于执行如上述任一实施例中基于知识图谱的参见落实校验方法的步骤。
本发明提供的计算机设备1,其所包含的处理器14用于执行如上述任一实施例中基于知识图谱的参见落实校验方法的步骤,因而该计算机设备1能够实现该基于知识图谱的参见落实校验方法全部的有益效果,在此不再赘述。
本发明的另一方面实施例,提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如基于知识图谱的参见落实校验方法的步骤。
本发明提供的计算机可读存储介质,其上存储的计算机程序被处理器执行时实现了如上述任一实施例中基于知识图谱的参见落实校验方法的步骤,因而该计算机可读存储介质能够实现该基于知识图谱的参见落实校验方法全部的有益效果,在此不再赘述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。