CN112559772B - 一种知识图谱动态维护方法、终端设备及存储介质 - Google Patents
一种知识图谱动态维护方法、终端设备及存储介质 Download PDFInfo
- Publication number
- CN112559772B CN112559772B CN202011594681.0A CN202011594681A CN112559772B CN 112559772 B CN112559772 B CN 112559772B CN 202011594681 A CN202011594681 A CN 202011594681A CN 112559772 B CN112559772 B CN 112559772B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- narrative
- relationship
- entity
- ontology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种知识图谱动态维护方法、终端设备及存储介质,该方法中包括:S1:采集业务数据;S2:加载叙词表文件,根据叙词表文件从业务数据中抽取知识;S3:将叙词表转化为本体中的概念和概念之间的关系;S4:将提取的各知识分类至叙词表中的具体概念下;S5:根据各知识和叙词表中与知识相关联的各概念,构建新的知识本体及知识本体间的关系;S6:将新的知识本体及关系与已有的知识本体及关系进行合并;S7:根据合并后的知识本体更新知识图谱和叙词表;S8:对于新增的概念,遵循叙词表的分类原则,根据语义分析,发现新增概念的上位叙词及对应的概念类别,增加新的概念实体。本发明解决了更新知识图谱存在滞后性、扩展不灵活且效率低的问题。
Description
技术领域
本发明涉及知识图谱领域,尤其涉及一种知识图谱动态维护方法、终端设备及存储介质。
背景技术
知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,便于计算机更好的管理、计算和理解互联网海量信息。本体是抽象化概念的集合,可包括人、场所、物品、事件、组织、内容等。实体是本体与实例的结合体。通常结构化的知识是以图形式进行表示,图的节点表示语义符号(实体,概念),图的边表示符号之间的语义关系,此外每个实体还有一些非实体级别的边(通常称之为属性),如:人物的出生日期,主要成就等。
当知识图谱构建完成后,随着新知识本体的出现、已有知识本体本身的演化、本体之间语义关系的变化,需及时发现这些变化并更新知识图谱。然而,在知识本体语义关系维护方面,目前要么基本处于静态,要么对于新接入的业务数据,需要人工发现新的知识本体和人工更新知识本体,以实现知识图谱中概念层的维护。通过人工发现或归并本体的方式,费时费力,且特定领域需专家参与,使得更新知识图谱滞后,不够准确,扩展性差且更新效率低。
发明内容
为了解决上述问题,本发明提出了一种知识图谱动态维护方法、终端设备及存储介质。
具体方案如下:
一种知识图谱动态维护方法,包括以下步骤:
S1:采集业务数据;
S2:加载叙词表文件,根据叙词表文件从业务数据中抽取实体知识、实体属性知识和实体关系知识三种知识;
S3:将叙词表内的叙词转化为本体中的概念,将叙词表内叙词间的词间关系转化为概念之间的关系;
S4:根据转化后的叙词表,将步骤S2中提取的各知识分类至叙词表中的具体概念下;
S5:根据各知识和叙词表中与知识相关联的各概念,构建新的知识本体及知识本体间的关系;
S6:将新的知识本体中能够与知识图谱中已有知识本体进行对齐处理的知识本体进行合并,并将新的知识本体间的关系与已有的知识本体间的关系进行合并;
S7:根据合并后的知识本体更新知识图谱和叙词表;
S8:对于新增的业务特征、代码或非格式化描述,根据语义分析,提取新的叙词,并根据叙词表的分类体系,扩展叙词表中的叙词构成后,重复执行步骤S2~S7。
进一步的,实体知识、实体属性知识和实体关系知识分别通过结构化抽取、非结构化抽取、专项抽取三种方式进行抽取。
进一步的,步骤S2还包括通过自然语言处理的技术来合并表述方式不同的同一实体。
进一步的,对叙词表的词间关系的转化包括:
1)根据属种关系和整体与部分关系确定本体间的等级关系;
2)根据本体间的属性关系确定本体间的相关关系;
3)根据同义词和近义词确定本体间的等同关系。
进一步的,步骤S5中通过实体的相似度计算、上下位关系挖掘、实体关系或属性统计分析和知识推理的方法构建新的知识本体及知识本体间的关系。
进一步的,步骤S8中遵循叙词表的分类原则,根据语义分析,发现新增概念的上位叙词及对应的概念类别,增加新的概念实体。
一种知识图谱动态维护终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
本发明采用如上技术方案,解决了更新知识图谱存在滞后性、扩展不灵活且效率低的问题,实现了知识图谱及时、准确地更新与扩展,同时能反哺叙词表。
附图说明
图1所示为本发明实施例一的流程图。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
现结合附图和具体实施方式对本发明进一步说明。
实施例一:
本发明实施例提供了一种知识图谱动态维护方法,如图1所示,其为本发明实施例所述的知识图谱动态维护方法的流程图,所述方法包括以下步骤:
S1:采集业务数据。
该实施例中采集的业务数据主要包括两方面的内容,一是新出现了热门实体,其需要被及时发现和下载其信息,二是实体之间关系属性变化的情况需要对该关系属性值进行替换或者补充。
S2:加载叙词表文件,根据叙词表文件对业务数据进行语义化处理,即从业务数据中抽取实体知识、实体属性知识和实体关系知识三种知识。
该实施例中支持excel、csv、Qracle、mysql等格式的叙词表文件的加载,实体知识、实体属性知识和实体关系知识分别通过结构化抽取、非结构化抽取、专项抽取三种方式进行抽取。
为了对三种知识进行类别区分,还包括对三种知识的类别进行标注。
进一步的,还包括通过实体统一、指代消解等自然语言处理的技术来合并表述方式不同的同一实体,以减少实体的种类。如“北大”与“北京大学”合并为同一实体”北京大学”。
S3:将叙词表转换成本体,即将叙词表内的叙词转化为本体中的概念,将叙词表内叙词间的词间关系转化为概念之间的关系。
叙词表可以作为向本体转化的基础,但是大部分叙词表所表述的词间关系太过宽泛,不能达到本体中精确语义的要求,因此,需要对叙词表的叙词及词间关系进行转化,将叙词转变成领域本体中的概念,将叙词表中宽泛、不准确的词间关系明确为概念间关系,使叙词表真正成为领域本体的建设资源。
对叙词表的词间关系的转化包括:
1)等级关系转化:分离出属种关系和整体与部分关系并准确归入对应的本体间关系;
2)相关关系转化:确定本体间的属性关系;
3)等同关系转化,根据同义词和近义词确定,本体构建最好选择叙词作为概念处理,许多非叙词作为不同历史时期的词汇单元,随着社会的发展已不再使用。
另外,在每一类型关系下,检查各概念之间的关系是否符合本体构建中基本关系的定义,对于不符合规定的概念进行删除、合并或者添加新的概念。
进一步的,该实施例中还包括根据叙词的限义词和注释添加本体属性,并为本体添加实例。为本体添加实例,即将多源知识映射到本体中,并对其关系属性信息进行去噪、归一化处理等。
S4:根据转化后的叙词表,将步骤S2中提取的各知识分类至叙词表中的具体概念下。
S5:根据各知识和叙词表中与知识相关联的各概念,构建新的知识本体及知识本体间的关系。
该实施例中通过实体的相似度计算、上下位关系挖掘、实体关系或属性统计分析和知识推理的方法构建新的知识本体及知识本体间的关系。
S6:将新的知识本体中能够与知识图谱中已有知识本体进行对齐处理的知识本体进行合并,并将新的知识本体间的关系与已有的知识本体间的关系进行合并。
S7:根据合并后的知识本体更新知识图谱和叙词表。
S8:对于新增的业务特征、代码或非格式化描述,根据语义分析,提取新的叙词,并根据叙词表的分类体系,扩展叙词表中的叙词构成后,重复执行步骤S2~S7。
将新形成的知识本体及其关系用本体语言表示,更新到知识图谱的概念层,对于移除的概念,需将之前分类到该概念之下的实体移动到别的对应位置。对于新增的概念,遵循叙词表的分类原则,根据语义分析,发现新增概念的上位叙词及对应的概念类别,增加新的概念实体;对于原有的概念,将新获取的实体正常分类到对应的概念体系下;进而将新获取的实体关系、属性补充、扩展或替换实体间关系、属性即可。用抽取的新知识本体更新叙词表,比如依据新增的本体概念在已有叙词表中添加叙词。
本发明实施例一通过加载叙词表,对新获取的业务数据进行语义化处理,将新构建的知识本体与已有的融合,实现了已有本体的共享和复用,也实现了知识图谱概念层即本体的半自动化动态维护,加快了图谱更新的节奏和准确性,进而提升了大数据合理地可视化呈现万事万物的效率。同时用新本体反哺叙词表,扩充了领域知识。
实施例二:
本发明还提供一种知识图谱动态维护终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
进一步地,作为一个可执行方案,所述知识图谱动态维护终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述知识图谱动态维护终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述知识图谱动态维护终端设备的组成结构仅仅是知识图谱动态维护终端设备的示例,并不构成对知识图谱动态维护终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述知识图谱动态维护终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述知识图谱动态维护终端设备的控制中心,利用各种接口和线路连接整个知识图谱动态维护终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述知识图谱动态维护终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
所述知识图谱动态维护终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)以及软件分发介质等。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。
Claims (6)
1.一种知识图谱动态维护方法,其特征在于,包括以下步骤:
S1:采集业务数据;
S2:加载叙词表文件,根据叙词表文件从业务数据中抽取实体知识、实体属性知识和实体关系知识三种知识,通过自然语言处理的技术来合并表述方式不同的同一实体;
S3:将叙词表内的叙词转化为本体中的概念,将叙词表内叙词间的词间关系转化为概念之间的关系;对叙词表的词间关系的转化包括:
1)根据属种关系和整体与部分关系确定本体间的等级关系;
2)根据本体间的属性关系确定本体间的相关关系;
3)根据同义词和近义词确定本体间的等同关系;
S4:根据转化后的叙词表,将步骤S2中提取的各知识分类至叙词表中的具体概念下;
S5:根据各知识和叙词表中与知识相关联的各概念,构建新的知识本体及知识本体间的关系;
S6:将新的知识本体中能够与知识图谱中已有知识本体进行对齐处理的知识本体进行合并,并将新的知识本体间的关系与已有的知识本体间的关系进行合并;
S7:根据合并后的知识本体更新知识图谱和叙词表;
S8:对于新增的业务特征、代码或非格式化描述,根据语义分析,提取新的叙词,并根据叙词表的分类体系,扩展叙词表内的叙词构成后,重复执行步骤S2~ S7。
2.根据权利要求1所述的知识图谱动态维护方法,其特征在于:实体知识、实体属性知识和实体关系知识分别通过结构化抽取、非结构化抽取、专项抽取三种方式进行抽取。
3.根据权利要求1所述的知识图谱动态维护方法,其特征在于:步骤S5中通过实体的相似度计算、上下位关系挖掘、实体关系或属性统计分析和知识推理的方法构建新的知识本体及知识本体间的关系。
4.根据权利要求1所述的知识图谱动态维护方法,其特征在于:步骤S8中遵循叙词表的分类原则,根据语义分析,发现新增概念的上位叙词及对应的概念类别,增加新的概念实体。
5.一种知识图谱动态维护终端设备,其特征在于:包括处理器、存储器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~4中任一所述方法的步骤。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1~4中任一所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011594681.0A CN112559772B (zh) | 2020-12-29 | 2020-12-29 | 一种知识图谱动态维护方法、终端设备及存储介质 |
EP21209157.3A EP4024263A1 (en) | 2020-12-29 | 2021-11-18 | Method for dynamic maintenance of a knowledge graph, terminal device and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011594681.0A CN112559772B (zh) | 2020-12-29 | 2020-12-29 | 一种知识图谱动态维护方法、终端设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112559772A CN112559772A (zh) | 2021-03-26 |
CN112559772B true CN112559772B (zh) | 2022-09-09 |
Family
ID=75032809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011594681.0A Active CN112559772B (zh) | 2020-12-29 | 2020-12-29 | 一种知识图谱动态维护方法、终端设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP4024263A1 (zh) |
CN (1) | CN112559772B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792123B (zh) * | 2021-11-17 | 2022-02-15 | 广州极天信息技术股份有限公司 | 一种基于数据驱动的领域知识图谱构建方法及系统 |
CN114547346B (zh) * | 2022-04-22 | 2022-08-02 | 浙江太美医疗科技股份有限公司 | 知识图谱的构建方法和装置、电子设备和存储介质 |
CN117033527B (zh) * | 2023-10-09 | 2024-01-30 | 之江实验室 | 一种知识图谱的构建方法、装置、存储介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN111209412A (zh) * | 2020-02-10 | 2020-05-29 | 同方知网(北京)技术有限公司 | 一种循环更新迭代的期刊文献知识图谱构建方法 |
CN111209410A (zh) * | 2019-12-27 | 2020-05-29 | 中国地质大学(武汉) | 一种基于锚点的动态知识图谱表示学习方法及系统 |
CN111563173A (zh) * | 2020-05-09 | 2020-08-21 | 北京中科院软件中心有限公司 | 一种基于制造领域的知识图谱构建方法及系统 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10002325B2 (en) * | 2005-03-30 | 2018-06-19 | Primal Fusion Inc. | Knowledge representation systems and methods incorporating inference rules |
US8747115B2 (en) * | 2012-03-28 | 2014-06-10 | International Business Machines Corporation | Building an ontology by transforming complex triples |
US9997157B2 (en) * | 2014-05-16 | 2018-06-12 | Microsoft Technology Licensing, Llc | Knowledge source personalization to improve language models |
US20190188332A1 (en) * | 2017-12-15 | 2019-06-20 | Mito.AI AS | System of dynamic knowledge graph based on probabalistic cardinalities for timestamped event streams |
-
2020
- 2020-12-29 CN CN202011594681.0A patent/CN112559772B/zh active Active
-
2021
- 2021-11-18 EP EP21209157.3A patent/EP4024263A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106447346A (zh) * | 2016-08-29 | 2017-02-22 | 北京中电普华信息技术有限公司 | 一种智能电力客服系统的构建方法及系统 |
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN110222201A (zh) * | 2019-06-26 | 2019-09-10 | 中国医学科学院医学信息研究所 | 一种专病知识图谱构建方法及装置 |
CN111209410A (zh) * | 2019-12-27 | 2020-05-29 | 中国地质大学(武汉) | 一种基于锚点的动态知识图谱表示学习方法及系统 |
CN111209412A (zh) * | 2020-02-10 | 2020-05-29 | 同方知网(北京)技术有限公司 | 一种循环更新迭代的期刊文献知识图谱构建方法 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN111563173A (zh) * | 2020-05-09 | 2020-08-21 | 北京中科院软件中心有限公司 | 一种基于制造领域的知识图谱构建方法及系统 |
Non-Patent Citations (1)
Title |
---|
教育知识图谱更新与维护的方法研究;李天宇;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190615(第6期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112559772A (zh) | 2021-03-26 |
EP4024263A1 (en) | 2022-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559772B (zh) | 一种知识图谱动态维护方法、终端设备及存储介质 | |
US10725836B2 (en) | Intent-based organisation of APIs | |
US7930322B2 (en) | Text based schema discovery and information extraction | |
US11853352B2 (en) | Method and apparatus for establishing image set for image recognition, network device, and storage medium | |
US9875301B2 (en) | Learning multimedia semantics from large-scale unstructured data | |
US20170075983A1 (en) | Subject-matter analysis of tabular data | |
van Altena et al. | Understanding big data themes from scientific biomedical literature through topic modeling | |
KR20100038378A (ko) | 지능적인 텍스트 주석을 위한 방법, 시스템 및 컴퓨터 프로그램 | |
US20200401910A1 (en) | Intelligent causal knowledge extraction from data sources | |
CN103425740B (zh) | 一种面向物联网的基于语义聚类的物资信息检索方法 | |
EP3811237A1 (en) | Taxonomic tree generation | |
Madani et al. | Sentiment analysis using semantic similarity and Hadoop MapReduce | |
WO2019245886A1 (en) | Topic set refinement | |
Doloreux et al. | Territorial innovation models: to be or not to be, that’s the question | |
CN105378717A (zh) | 用于对社交媒体的用户分类的方法、计算机程序和计算机 | |
Al-Hawari et al. | Classification of application reviews into software maintenance tasks using data mining techniques | |
CN114328799A (zh) | 数据处理方法、装置以及计算机可读存储介质 | |
KR102156287B1 (ko) | 처방적 분석 기반 지능형 연구정보 고부가 가치화 제공 플랫폼 및 그 방법 | |
Mishra et al. | Automatic word embeddings-based glossary term extraction from large-sized software requirements | |
CN113767403B (zh) | 知识图中过指定和欠指定的自动解析 | |
Song et al. | Methodologies for semi-automated conceptual data modeling from requirements | |
Nejjahi et al. | Towards classification of web ontologies using the horizontal and vertical segmentation | |
Ait‐Yakoub et al. | Asymmetric composition of possibilistic operators in formal concept analysis: Application to the extraction of attribute implications from incomplete contexts | |
CN104281570A (zh) | 信息处理方法和装置以及机构名规范化方法和设备 | |
Zemmouchi-Ghomari et al. | Ontology versus terminology, from the perspective of ontologists |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |