CN111309925B - 一种军事装备的知识图谱构建方法 - Google Patents

一种军事装备的知识图谱构建方法 Download PDF

Info

Publication number
CN111309925B
CN111309925B CN202010084156.8A CN202010084156A CN111309925B CN 111309925 B CN111309925 B CN 111309925B CN 202010084156 A CN202010084156 A CN 202010084156A CN 111309925 B CN111309925 B CN 111309925B
Authority
CN
China
Prior art keywords
military equipment
knowledge graph
knowledge
military
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010084156.8A
Other languages
English (en)
Other versions
CN111309925A (zh
Inventor
梅楚璇
段飞虎
邓凤
刘红阳
郎志国
冯自强
张宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongfang Knowledge Network Digital Publishing Technology Co ltd
Original Assignee
Tongfang Knowledge Network Digital Publishing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongfang Knowledge Network Digital Publishing Technology Co ltd filed Critical Tongfang Knowledge Network Digital Publishing Technology Co ltd
Priority to CN202010084156.8A priority Critical patent/CN111309925B/zh
Publication of CN111309925A publication Critical patent/CN111309925A/zh
Application granted granted Critical
Publication of CN111309925B publication Critical patent/CN111309925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明公开了一种军事装备的知识图谱构建方法,包括:构建军事装备知识图谱;根据已有的图谱数据,自动构建军事装备规则知识库,包括实体规则和数值性规则;抽取军事装备实体,并根据已有的军事装备实体的特征,在非结构化的军事语料中提取新的军事装备实体;基于提取的军事装备实体,将语料划分为多个文本片段;抽取文本片段数值属性,并分析已有的武器装备的属性;基于HowNet概念关系词典,对知识图谱中的实体词进行上位词、下位词、同义词、反义词关系扩充;融合知识图谱数据和基于知识规则库得到的知识图谱数据,并将融合后的知识图谱数据进行加工。本发明基于网络上的结构数据和规则的办法,会得到更准确的结果,也便于调整和维护。

Description

一种军事装备的知识图谱构建方法
技术领域
本发明涉及文本数据挖掘和自然语言处理技术领域,尤其涉及一种军事装备的知识图谱构建方法。
背景技术
随着信息技术的迅猛发展,文本数据呈爆炸式增长,人们期待计算机能够代替人力,从文本数据中快速准确地提取出新的、有效的知识。而在知识表示领域,传统的知识表示技术已经无法满足人们的需求,知识图谱技术应运而生,通过构建知识图谱,知识不再是一盘散沙,而是通过点和线表示海量知识之间的关系,语义丰富,清晰直观,方便用户理解和分析。在军事装备这个特定领域,自动构建知识图谱,可以用于优化作战策略、培育军事人才,同时可以减少人力成本,避免军事领域外人员接触机密信息。
现有的知识图谱构建技术一般是以下3个步骤多次迭代生成的:知识抽取、知识融合和知识加工。其中最基础、最关键的一步是知识抽取,如何从非结构化的文本中抽取到实体、实体的属性以及实体之间的关系,涉及到了实体识别、属性抽取、关系抽取等技术;知识融合是对知识抽取结果的优化,需要去除图谱中冗余、矛盾、歧义的部分,建立层次和逻辑;知识加工过程通过评估筛选知识,存入知识库,并通过推理发现新的知识。然而,若针对某一领域,结合该领域的数据特点,具体问题具体研究,将会比通用的知识图谱构建技术达到更好的效果。
基于上述原因,本文提出了一种军事装备的知识图谱构建方法。基于网络爬取的数据构建规则库,来获取更多的数据,采用主题词典搜索、属性抽取、实体识别、关系抽取等技术,自动构建知识图谱。
发明内容
为解决上述技术问题,本发明的目的是提供一种军事装备知识图谱的构建方法,该方法主要是爬取网络上的军事数据,构建三元组和规则库,基于规则库,提出了军事装备实体提取方法和属性分类抽取的方法,补充三元组,构建知识图谱。
本发明的目的通过以下的技术方案来实现:
一种军事装备知识图谱的构建方法,包括:
A构建军事装备知识图谱;
B根据已有的图谱数据,自动构建军事装备规则知识库,包括实体规则和数值性规则;
C抽取军事装备实体,并根据已有的军事装备实体的特征,在非结构化的军事语料中提取新的军事装备实体;
D基于提取的军事装备实体,将语料划分为多个文本片段;
E抽取文本片段数值属性,并分析已有的武器装备的属性;
F基于HowNet概念关系词典,对知识图谱中的实体词进行上位词、下位词、同义词、反义词关系扩充;
G融合知识图谱数据和基于知识规则库得到的知识图谱数据,并将融合后的知识图谱数据进行加工。
与现有技术相比,本发明的一个或多个实施例可以具有如下优点:
由于军事装备知识图谱对数据的准确性要求较高,基于网络上的结构数据和规则的办法,会得到更准确的结果,也便于调整和维护。
附图说明
图1是军事装备知识图谱的构建方法流程图;
图2是爬取武器库百科中的结构数据图;
图3是爬虫爬取网络军事装备数据的流程图;
图4是自底向上构建知识图谱的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。
如图1所示,为军事装备知识图谱的构建方法流程,包括:
步骤10构建军事装备知识图谱;从互联网上爬取武器库百科中的结构数据,网页数据如图2所示。获取武器的类别、武器实体名称、武器实体属性(如口径、发动机数量、飞行速度等)。根据获取到的数据,构建如下所示的三元组:
<军事装备,SUB_CLASS,飞行器>、<飞行器,SUB_CLASS,战斗机>、<战斗机,SUB_ENTITY,A-7攻击机>、<A-7攻击机,飞行速度,1,112千米每小时>。
基于已有的图谱数据,提出自底向上的军事装备知识图谱构建方法。
步骤20根据已有的图谱数据,自动构建军事装备规则知识库,包括实体规则和数值性规则。
由于武器装备中一般含有类别名,并经常出现字母、数字和“-”、“/”等符号,具有一定的规则,但是正则表达式较难书写,因此构建如下的实体规则库。
1、构建军事装备类别名词典,一级分类(飞行器、舰船舰艇、枪械与单兵等8种)和二级分类名称(如飞行器的二级分类战斗机、攻击机、轰炸机、教练机等近100种),也可人工辅助添加。
2、将已知的军事装备实体中的字母、数字和特殊符号用“#”代替,如“A-7攻击机”、“中岛九七式战斗机”改为“#攻击机”、“中岛#式战斗机”,然后加载军事装备类别名词典将这些军事实体分词处理,计算类别名出现的频次、除类别名外其他词出现的频次,以及这些词和类别名共同出现的频次,存入军事装备实体规则数据库。
分析已有的武器装备的属性,发现其大部分属性都为数值属性,如机高3.1米、空重1174千克、最大飞行速度287千米每小时等。因此统计所有已知属性值的单位、对应的属性名称,并将数据存入数值属性规则数据库。
步骤30抽取军事装备实体,并根据已有的军事装备实体的特征,在非结构化的军事语料中提取新的军事装备实体,具体步骤如下:
1、在待处理文本中提取出含有军事装备类别名的句子,替换掉字母、数字和特殊字符之后,作分句、分词处理,查找类别名所在句子前后8个词的范围内的词和类别名,查询实体规则数据库,按以下公式,确定该词是否属于军事装备实体,从而获取实体的开始、结束位置。
Figure BDA0002381430220000041
其中,n(a)表示词a在已有装备中出现的概率,n(ab)表示词a和词b已有的装备中共同出现的概率。若r值大于所设的阈值,则实体应该包含该词语,直至r值小于阈值或超过划定范围停止;
2、获取到的军事装备实体,可以根据类别名,得到如下的关系三元组,<类别名,SUB_ENTITY,军事装备实体>。
步骤40基于提取的军事装备实体,将语料划分为多个文本片段;
分割语料,按照汉语习惯,预设在一个军事装备名出现后,下一个军事装备名出现前,中间的文本都是介绍关于前者的。基于步骤30中提取的军事装备实体,将语料划分为多个文本片段,抽取数值属性。
步骤50抽取文本片段数值属性,并分析已有的武器装备的属性;发现其大部分属性都为数值属性,如机高3.1米、空重1174千克、最大飞行速度287千米每小时等。因此采用分类别抽取属性的方法,比直接通过句法依存分析等算法提取属性,得到的结果更为准确。具体的属性抽取方法如下所述:
1、数据准备:统计所有已知属性值的单位、对应的属性名称,并将数据存入数据库。
2、文本预处理:将上一步中收集的所有的单位、属性名称构成词典,加载后对文本片段分句、分词。
3、对其中的一个文本片段,若在文本中出现在同一个句子里或者相邻出现的属性名和单位,也在数据库中出现过记录,则该属性值(需要将数字和单位组合)为该属性名对应的值,简单有效。
4、将文本片段用BiLSTM+CRF模型进行命名实体识别(军事装备的设计师、研发机构、首飞时间等,需要用到人名、机构名、时间识别)、通过词性标注获取词性标签、根据依存句法分析得到依存标签和句法依存树,根据核心谓语和依存句法分析结果抽取其他属性,当句子缺乏核心谓语时,按照就近原则提取属性。
5、由于军事装备知识图谱具有关系级联程度不高的提点,这里将军事装备的属性也构建成如下的关系三元组,丰富知识图谱,后续如果涉及到关于属性的知识问答,也更加方便。三元组为<军事装备名,属性名,属性值>。
步骤60基于HowNet概念关系词典,对知识图谱中的实体词进行上位词、下位词、同义词、反义词关系扩充,丰富图谱中的词义,便于用户理解知识、扩展思维。
步骤70融合知识图谱数据和基于知识规则库得到的知识图谱数据,并将融合后的知识图谱数据进行加工。
其中,知识图谱数据的融合具体包括:
1、融合基于爬虫得到的知识图谱数据数据和基于知识规则库得到的知识图谱数据,在融合的过程中可以构建简称和全称的对应词典,融合同义但不同表达的节点名、关系名,如“机高”、“高度”、“高”等。
2、鉴于军事装备对精密性、准确性要求高的特点,基于规则库提取出的关系三元组需要专家审核。
3、图谱数据用图数据库Neo4j存储,Neo4j支持节点、关系、路径的搜索,可以满足基于军事装备知识图谱的搜索需求。
如图3设计爬虫程序,从军事环球网、百度百科等网页,爬取军事装备结构化数据,包括军事装备类别、实体、实体属性等,并构建三元组。
如图4为自底向上构建知识图谱的流程图,从军事语料中获取新的三元组,构建知识图谱。
将上述步骤10中获取的军事装备实体用“#”替换字母、数字、特殊符号后,分词处理,每个词和类别名的共同出现次数,存入军事装备实体规则数据库。数据库中的数据如下表格1所示。将数据库中的type(类别词)和word(其他词)均不为空的数据按照num的值降序排列,可以发现word的词均是武器中经常出现的词。
表1
Figure BDA0002381430220000061
将上述步骤10中获取的军事准备实体的属性中含有数字的部分去掉数字,将属性名和单位加入到实体属性规则库,属性规则数据库的数据如下表2所示:
表2
Figure BDA0002381430220000071
根据上述步骤30获取的实体规则知识库,根据词的共现次数提取军事语料中的军事装备实体名称,获取所属类别和军事装备实体的关系三元组。然后根据提取的实体将军事语料切分为一个个与军事装备实体对应的军事语料片段。
在步骤50获取的军事语料片段中,根据步骤40获取的数值属性规则知识库,提取属性信息,若在文本中出现在同一个句子里或者相邻出现规则库中的一条属性名和单位,则提取属性的关系三元组。然后用命名实体识别、词性分析、依存句法分析,提取其他的非数值属性。
基于HowNet概念词典扩展已经获取的关系三元组中实体的相关词语,丰富语义关系。
融合上述步骤中得到的关系三元组,经人工审核扩展部分数据后,构建知识图谱。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (2)

1.一种军事装备的知识图谱构建方法,其特征在于,所述方法包括:
A构建军事装备知识图谱;
B根据已有的图谱数据,自动构建军事装备规则知识库,包括实体规则和数值性规则;
C抽取军事装备实体,并根据已有的军事装备实体的特征,在非结构化的军事语料中提取新的军事装备实体;
D基于提取的军事装备实体,将语料划分为多个文本片段;
E抽取文本片段数值属性,并分析已有的武器装备的属性;
F基于HowNet概念关系词典,对知识图谱中的实体词进行上位词、下位词、同义词、反义词关系扩充;
G融合知识图谱数据和基于知识规则库得到的知识图谱数据,并将融合后的知识图谱数据进行加工;
所述步骤C中在非结构化的军事语料中提取新的军事装备实体包括:
在待处理文本中提取出含有军事装备类别名的句子,替换掉字母、数字和特殊字符之后,作分句、分词处理,查找类别名所在句子前后8个词的范围内的词和类别名,查询实体规则数据库,按以下公式,确定该词是否属于军事装备实体,从而获取实体的开始、结束位置;
Figure QLYQS_1
其中,n(a)表示词a在已有装备中出现的概率,n(ab)表示词a和词b已有的装备中共同出现的概率;若r值大于所设的阈值,则实体包含该词语,直至r值小于阈值或超过划定范围停止;
根据获取到的军事装备实体,根据类别名,得到类别名,SUB_ENTITY,军事装备实体,构建三元组;
所述步骤E中数值属性抽取包括:
(1)数据准备,统计所有已知属性值的单位、对应的属性名称,并将数据存入数据库;
(2)文本预处理,将收集的所有的单位、属性名称构成词典,加载后对文本片段分句、分词;
(3)对其中的一个文本片段,若在文本中出现在同一个句子里或者相邻出现的属性名和单位,也在数据库中出现过记录,则该属性值为该属性名对应的值;
(4)将文本片段用BiLSTM+CRF模型进行命名实体识别,通过词性标注获取词性标签、根据依存句法分析得到依存标签和句法依存树,根据核心谓语和依存句法分析结果抽取其他属性;
(5)将军事装备的属性也构建成军事装备名,属性名,属性值关系三元组。
2.如权利要求1所述的军事装备的知识图谱构建方法,其特征在于,所述步骤G中知识图谱数据的融合具体包括:
(1)融合基于爬虫得到的知识图谱数据和基于知识规则库得到的知识图谱数据,并在融合的过程中构建简称和全称的对应词典,融合同义但不同表达的节点名与关系名;
(2)审核基于规则库提取出的关系三元组;
(3)图谱数据用数据库Neo4j存储,其中Neo4j支持节点、关系、路径的搜索,满足基于军事装备知识图谱的搜索需求。
CN202010084156.8A 2020-02-10 2020-02-10 一种军事装备的知识图谱构建方法 Active CN111309925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010084156.8A CN111309925B (zh) 2020-02-10 2020-02-10 一种军事装备的知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010084156.8A CN111309925B (zh) 2020-02-10 2020-02-10 一种军事装备的知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN111309925A CN111309925A (zh) 2020-06-19
CN111309925B true CN111309925B (zh) 2023-06-30

Family

ID=71159887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010084156.8A Active CN111309925B (zh) 2020-02-10 2020-02-10 一种军事装备的知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN111309925B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753100A (zh) * 2020-06-30 2020-10-09 广州小鹏车联网科技有限公司 一种针对车载应用的知识图谱生成方法和服务器
CN111861185B (zh) * 2020-07-14 2021-02-05 中国人民解放军军事科学院战争研究院 一种基于任务树的任务智能推荐方法及装置
CN111897968A (zh) * 2020-07-20 2020-11-06 国网浙江省电力有限公司嘉兴供电公司 一种工业信息安全知识图谱构建方法和系统
CN112241459A (zh) * 2020-10-22 2021-01-19 山东超越数控电子股份有限公司 基于任务的武器装备知识图谱的查询和推荐方法及系统
CN112328855A (zh) * 2020-10-28 2021-02-05 博康智能信息技术有限公司 多源军事装备知识关联组织方法
CN112699248B (zh) * 2020-12-24 2022-09-16 厦门市美亚柏科信息股份有限公司 一种知识本体构建方法、终端设备及存储介质
CN113609838A (zh) * 2021-07-14 2021-11-05 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 文档信息抽取及图谱化方法和系统
CN113656594A (zh) * 2021-08-17 2021-11-16 河南工业大学 一种基于飞行器维修的知识推理方法
CN114372150B (zh) * 2021-12-10 2024-05-07 天翼物联科技有限公司 知识图谱构建方法、系统、装置及存储介质
CN114610860B (zh) * 2022-05-07 2022-09-27 荣耀终端有限公司 一种问答方法及系统
CN115238217B (zh) * 2022-09-23 2022-12-20 山东省齐鲁大数据研究院 一种公告文本中抽取数值信息的方法及终端机

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109213872A (zh) * 2018-09-11 2019-01-15 中国电子科技集团公司第二十八研究所 基于知识表示学习的实体关系预测方法及预测系统
CN109522396A (zh) * 2018-10-22 2019-03-26 中国船舶工业综合技术经济研究院 一种面向国防科技领域的知识处理方法及系统
CN109697233A (zh) * 2018-12-03 2019-04-30 中电科大数据研究院有限公司 一种知识图谱体系搭建方法
CN109885698A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种知识图谱构建方法及装置、电子设备
CN110598203A (zh) * 2019-07-19 2019-12-20 中国人民解放军国防科技大学 一种结合词典的军事想定文书实体信息抽取方法及装置
CN110597998A (zh) * 2019-07-19 2019-12-20 中国人民解放军国防科技大学 一种结合句法分析的军事想定实体关系抽取方法及装置
CN110619052A (zh) * 2019-08-29 2019-12-27 中国电子科技集团公司第二十八研究所 一种基于知识图谱的战场态势感知方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018072563A1 (zh) * 2016-10-18 2018-04-26 中兴通讯股份有限公司 一种知识图谱构建方法、装置及系统
CN109213872A (zh) * 2018-09-11 2019-01-15 中国电子科技集团公司第二十八研究所 基于知识表示学习的实体关系预测方法及预测系统
CN109522396A (zh) * 2018-10-22 2019-03-26 中国船舶工业综合技术经济研究院 一种面向国防科技领域的知识处理方法及系统
CN109697233A (zh) * 2018-12-03 2019-04-30 中电科大数据研究院有限公司 一种知识图谱体系搭建方法
CN109885698A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种知识图谱构建方法及装置、电子设备
CN110598203A (zh) * 2019-07-19 2019-12-20 中国人民解放军国防科技大学 一种结合词典的军事想定文书实体信息抽取方法及装置
CN110597998A (zh) * 2019-07-19 2019-12-20 中国人民解放军国防科技大学 一种结合句法分析的军事想定实体关系抽取方法及装置
CN110619052A (zh) * 2019-08-29 2019-12-27 中国电子科技集团公司第二十八研究所 一种基于知识图谱的战场态势感知方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于开源数据的军事领域知识图谱构建方法;赵瑜;《指挥信息系统与技术》;20190722;第65-69页 *
基于百科知识的军事装备知识图谱构建与应用;车金立;《兵器装备工程学报》;20190125;全文 *

Also Published As

Publication number Publication date
CN111309925A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN111309925B (zh) 一种军事装备的知识图谱构建方法
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
US9971974B2 (en) Methods and systems for knowledge discovery
CN104834735B (zh) 一种基于词向量的文档摘要自动提取方法
JP5904559B2 (ja) シナリオ生成装置、及びそのためのコンピュータプログラム
CN111143479A (zh) 基于dbscan聚类算法的知识图谱关系抽取与rest服务可视化融合方法
JP6403382B2 (ja) フレーズペア収集装置、及びそのためのコンピュータプログラム
US20070016863A1 (en) Method and apparatus for extracting and structuring domain terms
US20150006528A1 (en) Hierarchical data structure of documents
CN110888991B (zh) 一种弱标注环境下的分段式语义标注方法
CN109783806B (zh) 一种利用语义解析结构的文本匹配方法
JP5907393B2 (ja) 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム
Sabuna et al. Summarizing Indonesian text automatically by using sentence scoring and decision tree
CN106484797A (zh) 基于稀疏学习的突发事件摘要抽取方法
Yeasmin et al. Study of abstractive text summarization techniques
US20140089246A1 (en) Methods and systems for knowledge discovery
Yang et al. Ontology generation for large email collections.
CN114138979B (zh) 基于词拓展无监督文本分类的文物安全知识图谱创建方法
CN111444713B (zh) 新闻事件内实体关系抽取方法及装置
Zhang Start small, build complete: Effective and efficient semantic table interpretation using tableminer
Asa et al. A comprehensive survey on extractive text summarization techniques
CN114580557A (zh) 基于语义分析的文献相似度确定方法及装置
Idris et al. Comparative Study of Root and Light Stemming Algorithms for Arabic Document Categorisation based on Similarity Measures
Rafay et al. Exploiting document level semantics in document clustering
Mukherjee et al. Automatic extraction of significant terms from the title and abstract of scientific papers using the machine learning algorithm: A multiple module approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230518

Address after: Rooms B201, B202, B203, B205, B206, B207, B208, B209, B210, 2nd Floor, Building B-2, Zhongguancun Dongsheng Science and Technology Park, No. 66 Xixiaokou Road, Haidian District, Beijing, 100084 (Dongsheng District)

Applicant after: TONGFANG KNOWLEDGE NETWORK DIGITAL PUBLISHING TECHNOLOGY CO.,LTD.

Address before: 100084 Beijing city Haidian District Tsinghua University Tsinghua Yuan 36 zone B1410, Huaye building 1412, room 1414

Applicant before: TONGFANG KNOWLEDGE NETWORK (BEIJING) TECHNOLOGY Co.,Ltd.

Applicant before: TONGFANG KNOWLEDGE NETWORK DIGITAL PUBLISHING TECHNOLOGY CO.,LTD.

GR01 Patent grant
GR01 Patent grant