CN112860913A - 一种知识图谱的本体创建方法 - Google Patents

一种知识图谱的本体创建方法 Download PDF

Info

Publication number
CN112860913A
CN112860913A CN202110206766.5A CN202110206766A CN112860913A CN 112860913 A CN112860913 A CN 112860913A CN 202110206766 A CN202110206766 A CN 202110206766A CN 112860913 A CN112860913 A CN 112860913A
Authority
CN
China
Prior art keywords
concept
data
words
relationship
concept words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110206766.5A
Other languages
English (en)
Other versions
CN112860913B (zh
Inventor
李保平
杨建荣
龙磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huitong Guoxin Technology Co Ltd
Original Assignee
Guangzhou Huitong Guoxin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huitong Guoxin Technology Co Ltd filed Critical Guangzhou Huitong Guoxin Technology Co Ltd
Priority to CN202110206766.5A priority Critical patent/CN112860913B/zh
Publication of CN112860913A publication Critical patent/CN112860913A/zh
Application granted granted Critical
Publication of CN112860913B publication Critical patent/CN112860913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种知识图谱的本体创建方法,包括以下步骤:S1、汇集数据;S2、采集概念词,提取步骤S1中汇集的数据的概念词;S3、总结关系,基于数据之间的关系总结概念词与概念词之间的概念关系;S4、自动生成主体;S5、验证主体,验证主体是否成立,若主体不成立提示不成立的概念词和/或概念关系;S6、手动处理主体,对不成立的概念词和/或概念关系进行修改,以及对主体进行主观编辑。有益效果是:能够从各类型数据进行概念词提取与概念关系提取,使本体的构成全面丰富;在本体生成后进行检验,并将不成立的概念词和/或概念关系反馈给工作人员,工作人员人工进行修改和编辑处理,以提高生成的本体的准确性和可用性。

Description

一种知识图谱的本体创建方法
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种知识图谱的本体创建方法。
背景技术
知识图谱在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
知识图谱主要由本体、知识、数据构成,其中本体作为抽象层面是知识图谱建立的框架与导向。目前在本体创建过程中,只针对文本数据进行知识提取,并且本体构建后缺乏质检环节,容易出现差错。
发明内容
本发明的目的在于克服现有技术存在的以上问题,提供一种知识图谱的本体创建方法。
为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
一种知识图谱的本体创建方法,包括以下步骤:
S1、汇集数据,汇集待创建知识图谱所属范围内的全部数据;
S2、采集概念词,提取步骤S1中汇集的数据的概念词;
S3、总结关系,基于步骤S1中数据之间的关系总结概念词与概念词之间的概念关系;
S4、自动生成主体,将步骤S2中的概念词通过步骤S3中的概念关系关联后自动生成主体;
S5、验证主体,选取各个概念词所属的代表数据代入步骤S4中的主体中,验证主体是否成立,若主体不成立提示不成立的概念词和/或概念关系;
S6、手动处理主体,对不成立的概念词和/或概念关系进行修改,以及对主体进行主观编辑。
其中,所述步骤S2中采集概念词具体包括:
S21、将步骤S1中的全部数据按照数据来源进行一级分类,然后将数据按照数据类型进行二级分类,形成若干个数据集;
S22、采用配置有语义搜索引擎的分词器对文本数据进行分词处理,以提取文本数据中的文本数据概念词;
S23、对数值数据按照数据来源与对象类相结合的方式归纳总结提取数值数据概念词,对声音数据按照数据来源与对象类相结合的方式归纳总结提取声音数据概念词,对图像数据按照数据来源与对象类相结合的方式归纳总结提取图像数据概念词。
其中,所述步骤S3中总结关系具体包括:
S31、采用配置有语义搜索引擎的分词器对文本数据进行分词处理,以总结文本数据概念词与文本数据概念词之间的文-文概念关系;
S32、采用语义搜索引擎分别搜索文本数据概念词与数值数据概念词、文本数据概念词与声音数据概念词、文本数据概念词与图像数据概念词、声音数据概念词与数值数据概念词、图像数据概念词与数值数据概念词、声音数据概念词与图像数据概念词、声音数据概念词与声音数据概念词、图像数据概念词与图像数据概念词之间的文-数概念关系、文-声概念关系、文-图概念关系、声-数概念关系、图-数概念关系、声-图概念关系、声-声概念关系、图-图概念关系;
S33、根据数学、物理、化学原理总结数值数据概念词与数值数据概念词之间的数-数概念关系。
其中,所述步骤S4中自动生成主体具体包括:
S41、将具有概念关系的两个概念词通过对应的概念关系组合成一个关系小组;
S42、将所有关系小组中相同的概念词合并,从而生成主体。
其中,所述主体或为树状或为网状或为放射状结构。
其中,所述步骤S5中验证主体具体包括:从每个概念词所属的数据集中选取至少三组代表数据,将代表数据代入自动生成的主体中,利用概念关系验证该概念关系两边的概念词之间是否符合该概念关系;若一个概念词所属数据集中的代表数据与周围所有概念词所属数据集中的代表数据均不符合对应的概念关系,则该概念词提取存在问题,提示该概念词不成立;若一个概念词所属数据集中的代表数据与周围部分概念词所属数据集中的代表数据不符合对应的概念关系,则提示该概念关系不成立。
其中,所述步骤S6中手动处理主体具体包括:
S61、调取不成立的概念词的数据集、与其有概念关系的全部概念词的数据集、及与其有关的概念关系,首先判断该不成立的概念词的数据集组合是否正确,若数据集组合有问题则手动对数据集进行重新组合,数据集重新组合后人工拟定新的概念词,若数据集合无问题则直接人工拟定新的概念词,梳理新的概念词与原不成立的概念词周围的概念词之间的概念关系,替换原本体中不成立的概念词及其周围不成立的概念关系;
S62、调取不成立的概念关系两边的概念词的数据集,选取数据集中对应的数据逐对梳理数据关系,集合所有梳理的数据关系总结出两个概念词之间的概念关系,替换原本体中不成立的概念关系。
S63、人工筛除多余的概念词,并将这些多余的概念词及其与其他所需概念词之间的概念关系一同删除。
本发明的有益效果是:能够从各类型数据进行概念词提取与概念关系提取,使本体的构成全面丰富;在本体生成后进行检验,并将不成立的概念词和/或概念关系反馈给工作人员,工作人员人工进行修改和编辑处理,以提高生成的本体的准确性和可用性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例中本体创建方法的流程图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
如图1所示,一种知识图谱的本体创建方法,包括以下步骤:
S1、汇集数据,汇集待创建知识图谱所属范围内的全部数据;
S2、采集概念词,提取步骤S1中汇集的数据的概念词;
S3、总结关系,基于步骤S1中数据之间的关系总结概念词与概念词之间的概念关系;
S4、自动生成主体,将步骤S2中的概念词通过步骤S3中的概念关系关联后自动生成主体;
S5、验证主体,选取各个概念词所属的代表数据代入步骤S4中的主体中,验证主体是否成立,若主体不成立提示不成立的概念词和/或概念关系;
S6、手动处理主体,对不成立的概念词和/或概念关系进行修改,以及对主体进行主观编辑。
其中,所述步骤S2中采集概念词具体包括:
S21、将步骤S1中的全部数据按照数据来源进行一级分类,然后将数据按照数据类型进行二级分类,形成若干个数据集;
S22、采用配置有语义搜索引擎的分词器对文本数据进行分词处理,以提取文本数据中的文本数据概念词;
S23、对数值数据按照数据来源与对象类相结合的方式归纳总结提取数值数据概念词,对声音数据按照数据来源与对象类相结合的方式归纳总结提取声音数据概念词,对图像数据按照数据来源与对象类相结合的方式归纳总结提取图像数据概念词。
其中,所述步骤S3中总结关系具体包括:
S31、采用配置有语义搜索引擎的分词器对文本数据进行分词处理,以总结文本数据概念词与文本数据概念词之间的文-文概念关系;
S32、采用语义搜索引擎分别搜索文本数据概念词与数值数据概念词、文本数据概念词与声音数据概念词、文本数据概念词与图像数据概念词、声音数据概念词与数值数据概念词、图像数据概念词与数值数据概念词、声音数据概念词与图像数据概念词、声音数据概念词与声音数据概念词、图像数据概念词与图像数据概念词之间的文-数概念关系、文-声概念关系、文-图概念关系、声-数概念关系、图-数概念关系、声-图概念关系、声-声概念关系、图-图概念关系;
S33、根据数学、物理、化学原理总结数值数据概念词与数值数据概念词之间的数-数概念关系。
其中,所述步骤S4中自动生成主体具体包括:
S41、将具有概念关系的两个概念词通过对应的概念关系组合成一个关系小组;
S42、将所有关系小组中相同的概念词合并,从而生成主体。
其中,所述主体或为树状或为网状或为放射状结构。
其中,所述步骤S5中验证主体具体包括:从每个概念词所属的数据集中选取至少三组代表数据,将代表数据代入自动生成的主体中,利用概念关系验证该概念关系两边的概念词之间是否符合该概念关系;若一个概念词所属数据集中的代表数据与周围所有概念词所属数据集中的代表数据均不符合对应的概念关系,则该概念词提取存在问题,提示该概念词不成立;若一个概念词所属数据集中的代表数据与周围部分概念词所属数据集中的代表数据不符合对应的概念关系,则提示该概念关系不成立。
其中,所述步骤S6中手动处理主体具体包括:
S61、调取不成立的概念词的数据集、与其有概念关系的全部概念词的数据集、及与其有关的概念关系,首先判断该不成立的概念词的数据集组合是否正确,若数据集组合有问题则手动对数据集进行重新组合,数据集重新组合后人工拟定新的概念词,若数据集合无问题则直接人工拟定新的概念词,梳理新的概念词与原不成立的概念词周围的概念词之间的概念关系,替换原本体中不成立的概念词及其周围不成立的概念关系;
S62、调取不成立的概念关系两边的概念词的数据集,选取数据集中对应的数据逐对梳理数据关系,集合所有梳理的数据关系总结出两个概念词之间的概念关系,替换原本体中不成立的概念关系。
S63、人工筛除多余的概念词,并将这些多余的概念词及其与其他所需概念词之间的概念关系一同删除。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (7)

1.一种知识图谱的本体创建方法,其特征在于,包括以下步骤:
S1、汇集数据,汇集待创建知识图谱所属范围内的全部数据;
S2、采集概念词,提取步骤S1中汇集的数据的概念词;
S3、总结关系,基于步骤S1中数据之间的关系总结概念词与概念词之间的概念关系;
S4、自动生成主体,将步骤S2中的概念词通过步骤S3中的概念关系关联后自动生成主体;
S5、验证主体,选取各个概念词所属的代表数据代入步骤S4中的主体中,验证主体是否成立,若主体不成立提示不成立的概念词和/或概念关系;
S6、手动处理主体,对不成立的概念词和/或概念关系进行修改,以及对主体进行主观编辑。
2.根据权利要求1所述的本体创建方法,其特征在于,所述步骤S2中采集概念词具体包括:
S21、将步骤S1中的全部数据按照数据来源进行一级分类,然后将数据按照数据类型进行二级分类,形成若干个数据集;
S22、采用配置有语义搜索引擎的分词器对文本数据进行分词处理,以提取文本数据中的文本数据概念词;
S23、对数值数据按照数据来源与对象类相结合的方式归纳总结提取数值数据概念词,对声音数据按照数据来源与对象类相结合的方式归纳总结提取声音数据概念词,对图像数据按照数据来源与对象类相结合的方式归纳总结提取图像数据概念词。
3.根据权利要求2所述的本体创建方法,其特征在于,所述步骤S3中总结关系具体包括:
S31、采用配置有语义搜索引擎的分词器对文本数据进行分词处理,以总结文本数据概念词与文本数据概念词之间的文-文概念关系;
S32、采用语义搜索引擎分别搜索文本数据概念词与数值数据概念词、文本数据概念词与声音数据概念词、文本数据概念词与图像数据概念词、声音数据概念词与数值数据概念词、图像数据概念词与数值数据概念词、声音数据概念词与图像数据概念词、声音数据概念词与声音数据概念词、图像数据概念词与图像数据概念词之间的文-数概念关系、文-声概念关系、文-图概念关系、声-数概念关系、图-数概念关系、声-图概念关系、声-声概念关系、图-图概念关系;
S33、根据数学、物理、化学原理总结数值数据概念词与数值数据概念词之间的数-数概念关系。
4.根据权利要求1所述的本体创建方法,其特征在于,所述步骤S4中自动生成主体具体包括:
S41、将具有概念关系的两个概念词通过对应的概念关系组合成一个关系小组;
S42、将所有关系小组中相同的概念词合并,从而生成主体。
5.根据权利要求1所述的本体创建方法,其特征在于:所述主体或为树状或为网状或为放射状结构。
6.根据权利要求1所述的本体创建方法,其特征在于:所述步骤S5中验证主体具体包括:从每个概念词所属的数据集中选取至少三组代表数据,将代表数据代入自动生成的主体中,利用概念关系验证该概念关系两边的概念词之间是否符合该概念关系;若一个概念词所属数据集中的代表数据与周围所有概念词所属数据集中的代表数据均不符合对应的概念关系,则该概念词提取存在问题,提示该概念词不成立;若一个概念词所属数据集中的代表数据与周围部分概念词所属数据集中的代表数据不符合对应的概念关系,则提示该概念关系不成立。
7.根据权利要求1所述的本体创建方法,其特征在于:所述步骤S6中手动处理主体具体包括:
S61、调取不成立的概念词的数据集、与其有概念关系的全部概念词的数据集、及与其有关的概念关系,首先判断该不成立的概念词的数据集组合是否正确,若数据集组合有问题则手动对数据集进行重新组合,数据集重新组合后人工拟定新的概念词,若数据集合无问题则直接人工拟定新的概念词,梳理新的概念词与原不成立的概念词周围的概念词之间的概念关系,替换原本体中不成立的概念词及其周围不成立的概念关系;
S62、调取不成立的概念关系两边的概念词的数据集,选取数据集中对应的数据逐对梳理数据关系,集合所有梳理的数据关系总结出两个概念词之间的概念关系,替换原本体中不成立的概念关系。
S63、人工筛除多余的概念词,并将这些多余的概念词及其与其他所需概念词之间的概念关系一同删除。
CN202110206766.5A 2021-02-24 2021-02-24 一种知识图谱的本体创建方法 Active CN112860913B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110206766.5A CN112860913B (zh) 2021-02-24 2021-02-24 一种知识图谱的本体创建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110206766.5A CN112860913B (zh) 2021-02-24 2021-02-24 一种知识图谱的本体创建方法

Publications (2)

Publication Number Publication Date
CN112860913A true CN112860913A (zh) 2021-05-28
CN112860913B CN112860913B (zh) 2024-03-08

Family

ID=75991008

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110206766.5A Active CN112860913B (zh) 2021-02-24 2021-02-24 一种知识图谱的本体创建方法

Country Status (1)

Country Link
CN (1) CN112860913B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761207A (zh) * 2021-09-14 2021-12-07 广州汇通国信科技有限公司 一种基于textCNN模型和知识图谱的电网数据分类方法及装置
CN114528417A (zh) * 2022-04-12 2022-05-24 北京中科闻歌科技股份有限公司 知识图谱本体构建方法、装置、设备及可读存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090010556A (ko) * 2007-07-23 2009-01-30 고려대학교 산학협력단 데이터베이스로부터 온톨로지를 생성하는 방법 및 그 장치
CN103336852A (zh) * 2013-07-24 2013-10-02 清华大学 跨语言本体构建方法及装置
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的系统及方法
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN107609052A (zh) * 2017-08-23 2018-01-19 中国科学院软件研究所 一种基于语义三角的领域知识图谱的生成方法及装置
CN107766556A (zh) * 2017-11-03 2018-03-06 福建工程学院 一种基于进化算法的交互式本体匹配方法和计算机设备
WO2018149326A1 (zh) * 2017-02-16 2018-08-23 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN108984647A (zh) * 2018-06-26 2018-12-11 北京工业大学 一种基于中文文本的水务领域知识图谱构建方法
CN110489562A (zh) * 2019-07-19 2019-11-22 国网福建省电力有限公司 一种基于本体的电网调度规程规定知识建模方法及系统
CN110569405A (zh) * 2019-08-26 2019-12-13 中电科大数据研究院有限公司 一种基于bert的政务公文本体概念抽取方法
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN110825721A (zh) * 2019-11-06 2020-02-21 武汉大学 大数据环境下高血压知识库构建与系统集成方法
CN110909175A (zh) * 2019-11-20 2020-03-24 清华大学 一种基于搜索引擎的在线课程概念知识图谱构建方法
CN110968650A (zh) * 2019-10-30 2020-04-07 清华大学 基于医生协助的医疗领域知识图谱构建方法
CN111177322A (zh) * 2019-12-30 2020-05-19 成都数之联科技有限公司 一种领域知识图谱的本体模型构建方法
CN111191051A (zh) * 2020-04-09 2020-05-22 速度时空信息科技股份有限公司 一种基于中文分词技术的应急知识图谱的构建方法及系统

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090010556A (ko) * 2007-07-23 2009-01-30 고려대학교 산학협력단 데이터베이스로부터 온톨로지를 생성하는 방법 및 그 장치
CN103336852A (zh) * 2013-07-24 2013-10-02 清华大学 跨语言本体构建方法及装置
CN106815293A (zh) * 2016-12-08 2017-06-09 中国电子科技集团公司第三十二研究所 一种面向情报分析的构建知识图谱的系统及方法
WO2018149326A1 (zh) * 2017-02-16 2018-08-23 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN107330007A (zh) * 2017-06-12 2017-11-07 南京邮电大学 一种基于多数据源的本体学习方法
CN107609052A (zh) * 2017-08-23 2018-01-19 中国科学院软件研究所 一种基于语义三角的领域知识图谱的生成方法及装置
CN107766556A (zh) * 2017-11-03 2018-03-06 福建工程学院 一种基于进化算法的交互式本体匹配方法和计算机设备
CN108984647A (zh) * 2018-06-26 2018-12-11 北京工业大学 一种基于中文文本的水务领域知识图谱构建方法
CN110489562A (zh) * 2019-07-19 2019-11-22 国网福建省电力有限公司 一种基于本体的电网调度规程规定知识建模方法及系统
CN110569405A (zh) * 2019-08-26 2019-12-13 中电科大数据研究院有限公司 一种基于bert的政务公文本体概念抽取方法
CN110569369A (zh) * 2019-09-16 2019-12-13 神州数码融信软件有限公司 银行金融系统知识图谱的生成方法及装置、应用方法及装置
CN110968650A (zh) * 2019-10-30 2020-04-07 清华大学 基于医生协助的医疗领域知识图谱构建方法
CN110825721A (zh) * 2019-11-06 2020-02-21 武汉大学 大数据环境下高血压知识库构建与系统集成方法
CN110909175A (zh) * 2019-11-20 2020-03-24 清华大学 一种基于搜索引擎的在线课程概念知识图谱构建方法
CN111177322A (zh) * 2019-12-30 2020-05-19 成都数之联科技有限公司 一种领域知识图谱的本体模型构建方法
CN111191051A (zh) * 2020-04-09 2020-05-22 速度时空信息科技股份有限公司 一种基于中文分词技术的应急知识图谱的构建方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761207A (zh) * 2021-09-14 2021-12-07 广州汇通国信科技有限公司 一种基于textCNN模型和知识图谱的电网数据分类方法及装置
CN114528417A (zh) * 2022-04-12 2022-05-24 北京中科闻歌科技股份有限公司 知识图谱本体构建方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN112860913B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN112579707B (zh) 一种日志数据的知识图谱构建方法
CN107832229A (zh) 一种基于nlp的系统测试用例自动生成方法
US20090234634A1 (en) Method for Automatically Modifying A Machine Translation and A System Therefor
CN102662930A (zh) 一种语料标注方法及装置
CN111488466B (zh) 中文带标记错误语料生成方法、计算装置和存储介质
CN107194617B (zh) 一种app软件工程师软技能分类系统及方法
KR101617696B1 (ko) 데이터 정규표현식의 마이닝 방법 및 장치
CN112860913A (zh) 一种知识图谱的本体创建方法
CN109947952A (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
CN113886567A (zh) 一种基于知识图谱的教学方法及系统
Stiller et al. Automatic enrichments with controlled vocabularies in Europeana: Challenges and consequences
CN111400505A (zh) 一种用电信息采集系统匹配故障消缺方案的方法及系统
CN110147552A (zh) 基于自然语言处理的教育资源质量评价挖掘方法及系统
CN113268603A (zh) 一种新闻舆情知识图谱的构建方法及装置、介质、设备
Bukar et al. Text analysis of chatgpt as a tool for academic progress or exploitation
CN115600605A (zh) 一种中文实体关系联合抽取方法、系统、设备及存储介质
CN111191413B (zh) 一种基于图排序模型的事件核心内容自动标记方法、装置及系统
CN113609008A (zh) 测试结果分析方法、装置和电子设备
CN107886309A (zh) 文档自动审查工具
Firmawan et al. Bidirectional long short-term memory for entailment identification in requirement specifications using information from Use Case diagrams
CN114842982B (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN110515926A (zh) 基于分词和语义依存分析的异构数据源海量数据梳理方法
CN112115362B (zh) 一种基于相似代码识别的编程信息推荐方法及装置
CN112328812B (zh) 基于自调参数的领域知识抽取方法与系统、电子设备
Jikeli et al. Antisemitic messages? a guide to high-quality annotation and a labeled dataset of tweets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant