CN113886602B - 一种基于多粒度认知的领域知识库实体识别方法 - Google Patents

一种基于多粒度认知的领域知识库实体识别方法 Download PDF

Info

Publication number
CN113886602B
CN113886602B CN202111213071.6A CN202111213071A CN113886602B CN 113886602 B CN113886602 B CN 113886602B CN 202111213071 A CN202111213071 A CN 202111213071A CN 113886602 B CN113886602 B CN 113886602B
Authority
CN
China
Prior art keywords
granularity
entity
knowledge base
word
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111213071.6A
Other languages
English (en)
Other versions
CN113886602A (zh
Inventor
林锋
李攀锋
陈樱珏
钟泠韵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202111213071.6A priority Critical patent/CN113886602B/zh
Publication of CN113886602A publication Critical patent/CN113886602A/zh
Application granted granted Critical
Publication of CN113886602B publication Critical patent/CN113886602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种基于多粒度认知的领域知识库实体识别方法,包括步骤:获取对应领域的数据文件,根据这些文件构建语料库,并将语料库分成训练集和测试集;对训练集数据进行字嵌入处理,获得自嵌入矩阵;将字嵌入矩阵分别作为实体识别模型中字粒度命名实体识别模块和全局粒度实体数量预测模块的输入,分别对两个模块进行训练;将两个粒度的损失函数进行联合,得到最终模型优化目标;利用获得的实体识别模型对测试集中的样本进行分类,识别该领域知识库实体。本发明能够解决小规模语料库的实体识别问题,在此基础上完成对应领域知识库的构建。

Description

一种基于多粒度认知的领域知识库实体识别方法
技术领域
本发明属于知识库实体识别技术领域,特别是涉及一种基于多粒度认知的领域知识库实体识别方法。
背景技术
知识库能够以结构化的形式描述客观世界中概念、实体及其关系,完成海量信息的有效组织、管理和理解。知识库系统在知识融合、智能问答、大数据决策等应用上的潜力受到了广泛的关注。知识库可以分为通用知识库和领域知识库两类,其中通用知识库是指面向通用一般领域的知识库,其通常覆盖很多方面,而领域知识库则是在特定的领域背景下所构建的知识库。不管是哪一类型的知识库,其本质都是一个以实体为节点的巨大网络,包括实体、实体属性以及实体间的关系。因此实体识别是进行知识库构建的第一步。
实体识别是指从文本中识别出具有特定意义的实体,并对其确定类别。实体识别在各种自然语言处理应用中发挥着重要作用,如信息抽取、信息检索、自动文本摘要、机器翻译、知识库等等。关于实体识别,国内外已经有了相当广泛的研究,用来实体识别的方法大致可以分成三类:基于规则的方法、基于传统机器学习的方法和基于深度学习的方法。基于规则的方法依赖于大量的手工规则,不需要语料的标注。但是规则的制定是耗时耗力的,在某些专业领域需要有专业知识的支持。基于规则的方法的可移植性受到限制,对于来自新领域的文本,需要通过更新规则来获得好的性能。因此,现在该方法慢慢地较少被使用。随着传统机器学习的发展,许多传统机器学习的方法被成功应用到实体识别任务中去,如隐马尔可夫模型、最大熵模型、条件随机场等等。除了单独使用机器学习算法外,也可以将多个方法进行结合,来完成实体识别任务。基于深度学习的方法,如双向长短期记忆神经网络模型,也成功应用到了实体识别任务中去。基于深度学习的方法相对于基于传统机器学习的方法,无需精心的特征工程,它能自动捕获输入文本中的上下文依赖,且能得到很好地表现。
然而,在实际的场景中,尤其构建某些特定领域的知识库时,由于样本匮乏或者受限于标注成本,造成可使用的训练数据较少,基于常规深度学习的方法对字词特征向量的学习效果欠佳。为此,出现了很多基于多任务学习的命名实体识别研究,如联合分词、词性标注、语义角色标注等任务。这些方法通过与其他相关任务的联合学习,对字词特征向量的捕捉效果有一定的提升,但需要额外进行辅助任务数据标注,在标注成本有限的场景下并不适用。
发明内容
为了解决上述问题,本发明提出了一种基于多粒度认知的领域知识库实体识别方法,能够解决小规模语料库的实体识别问题,在此基础上完成对应领域知识库的构建。
为达到上述目的,本发明采用的技术方案是:一种基于多粒度认知的领域知识库实体识别方法,包括步骤:
S10,获取对应领域的数据文件,根据这些文件构建语料库,并将语料库分成训练集和测试集;
S20,对训练集数据进行字嵌入处理,获得字嵌入矩阵;
S30,将字嵌入矩阵分别作为实体识别模型中字粒度命名实体识别模块和全局粒度实体数量预测模块的输入,分别对两个模块进行训练;将两个粒度的损失函数进行联合,得到最终模型优化目标;
S40,利用获得的实体识别模型对测试集中的样本进行分类,识别该领域知识库实体。
进一步的是,在所述步骤S20中,对训练集数据进行字嵌入处理,获得字嵌入矩阵,包括步骤:
在训练集中随机选取相关文件中的独立句子作为输入,通过预处理构建字表,将句子转化为高维独热编码矩阵,传入字嵌入层;字嵌入层将独热编码矩阵映射为压缩的低维字嵌入矩阵。
进一步的是,所述字粒度命名实体识别模块采用BiLSTM层和CRF层,预测标签序列并标定标签序列,实现字粒度的序列标记任务。
进一步的是,所述全局粒度实体数量预测模块采用BiLSTM结合注意力层,预测实体数量并标定实体数量,实现句子全局粒度的命名实体数量预测任务。
进一步的是,任意选择两个不在测试集中的文件,对于选中的文件进行分词,对分词结果进行人工标注,构建开发集,利用开发集对模型进行优化。
进一步的是,在模型优化的过程中,所述字粒度命名实体识别模块包括步骤:
S311,接收字嵌入矩阵,通过捕捉前后文语义信息,初步获取命名实体识别任务的标签预测概率;
S312,以命名实体识别双向长短记忆网络层的输出为发射矩阵,通过状态转移矩阵进一步修正命名实体识别任务的标签预测概率;
S313,根据分类结果和人工标注结果,计算命名实体识别在开发集上的损失函数值,采取log似然,损失函数值计算公式为:
其中,PRealPath为在给定观测序列x的条件下真实的目标序列的概率;P1-Pn为在给定观测序列x的条件下,预测目标序列yn的概率。
进一步的是,在模型优化的过程中,所述全局粒度实体数量预测模块包括步骤:
S321,接收字嵌入矩阵,通过捕捉前后向语义信息,进一步获取句子的语义特征;
S322,接收实体数量预测双向长短记忆网络层的输出特征矩阵,通过注意力机制获取句子的全局的重要特征信息,最终预测出该句子中包含的实体数量;
S323,根据分类结果和人工标注结果,计算实体数量预测在开发集上的损失函数值,采取交叉熵损失,损失函数值计算公式为:
其中,y为实体数量标定类别张量,为实体数量预测概率张量。
进一步的是,命名实体识别的损失函数Loss1采取log似然,实体数量预测的损失函数Loss2采取交叉熵损失,通过系数d将Loss1与Loss2联合,得到最终模型优化目标:Loss=Loss1+d*Loss2。
进一步的是,所述系数d为超参数,通过建立验证集进行调整。
采用本技术方案的有益效果:
本发明提出了一种结合字粒度与句子全局粒度的命名实体识别方法,在字粒度层面,模型解决命名实体识别任务,在句子全局粒度层面,模型解决命名实体数量预测任务,两个粒度认知任务共同联合优化,以提高命名实体识别效果。
本发明提出在BiLSTM+CRF命名实体识别模型上实现字粒度的序列标记任务,同时并列采用BiLSTM结合注意力层的全局粒度实体数量预测模块预测实体数量并标定实体数量,实现句子全局粒度的命名实体数量预测任务,引入基于多粒度认知的联合优化方法,能够解决小规模语料库的领域知识库中实体识别问题,得到的结果优于单独的实体识别方法,提高了识别效果。
附图说明
图1为本发明的一种基于多粒度认知的领域知识库实体识别方法流程示意图;
图2为本发明实施例中一种基于多粒度认知的领域知识库实体识别方法的原理示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步阐述。
在本实施例中,参见图1和图2所示,本发明提出了一种基于多粒度认知的领域知识库实体识别方法,包括步骤:
S10,获取对应领域的数据文件,根据这些文件构建语料库,并将语料库分成训练集和测试集;
S20,对训练集数据进行字嵌入处理,获得字嵌入矩阵;
S30,将字嵌入矩阵分别作为实体识别模型中字粒度命名实体识别模块和全局粒度实体数量预测模块的输入,分别对两个模块进行训练;将两个粒度的损失函数进行联合,得到最终模型优化目标;
S40,利用获得的实体识别模型对测试集中的样本进行分类,识别该领域知识库实体。
作为上述实施例的优化方案,在所述步骤S20中,对训练集数据进行字嵌入处理,获得字嵌入矩阵,包括步骤:
在训练集中随机选取相关文件中的独立句子作为输入,通过预处理构建字表,将句子转化为高维独热编码矩阵,传入字嵌入层;字嵌入层将独热编码矩阵映射为压缩的低维字嵌入矩阵。
作为上述实施例的优化方案,对给定包含m个样本的训练数据集,输入模型经过字嵌入过程后,传入学习器内字粒度命名实体识别模块和命名实体数量预测模块,根据预先标定值,得到两个模块的损失函数值,并对两个损失函数值进行联合。
所述字粒度命名实体识别模块采用BiLSTM层和CRF层,预测标签序列并标定标签序列,实现字粒度的序列标记任务。
所述全局粒度实体数量预测模块采用BiLSTM结合注意力层,预测实体数量并标定实体数量,实现句子全局粒度的命名实体数量预测任务。
优选的是,字嵌入维度300维,BiLSTM隐层维度256维,注意力隐层维度100维,实体数量预测区间数为5,粒度联合系数d为0.3.
作为上述实施例的优化方案,任意选择两个不在测试集中的文件,对于选中的文件进行分词,对分词结果进行人工标注,构建开发集,利用开发集对模型进行优化。
在模型优化的过程中,所述字粒度命名实体识别模块包括步骤:
S311,接收字嵌入矩阵,通过捕捉前后文语义信息,初步获取命名实体识别任务的标签预测概率;
S312,以命名实体识别双向长短记忆网络层的输出为发射矩阵,通过状态转移矩阵进一步修正命名实体识别任务的标签预测概率;
S313,根据分类结果和人工标注结果,计算命名实体识别在开发集上的损失函数值,采取log似然,损失函数值计算公式为:
其中,PRealPath为在给定观测序列x的条件下真实的目标序列的概率;P1-Pn为在给定观测序列x的条件下,预测目标序列yn的概率。
在模型优化的过程中,所述全局粒度实体数量预测模块包括步骤:
S321,接收字嵌入矩阵,通过捕捉前后向语义信息,进一步获取句子的语义特征;
S322,接收实体数量预测双向长短记忆网络层的输出特征矩阵,通过注意力机制获取句子的全局的重要特征信息,最终预测出该句子中包含的实体数量;
S323,根据分类结果和人工标注结果,计算实体数量预测在开发集上的损失函数值,采取交叉熵损失,损失函数值计算公式为:
其中,y为实体数量标定类别张量,为实体数量预测概率张量。
在所述学习器模型优化的过程中,为实现两个粒度联合优化,命名实体识别的损失函数Loss1采取log似然,实体数量预测的损失函数Loss2采取交叉熵损失,通过系数d将Loss1与Loss2联合,得到最终模型优化目标:Loss=Loss1+d*Loss2。
所述系数d为超参数,通过建立验证集进行调整。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (9)

1.一种基于多粒度认知的领域知识库实体识别方法,其特征在于,包括步骤:
S10,获取对应领域的数据文件,根据这些文件构建语料库,并将语料库分成训练集和测试集;
S20,对训练集数据进行字嵌入处理,获得字嵌入矩阵;
S30,将字嵌入矩阵分别作为实体识别模型中字粒度命名实体识别模块和句子全局粒度实体数量预测模块的输入,分别对两个模块进行训练;将两个粒度的损失函数进行联合,得到最终模型优化目标;
S40,利用获得的实体识别模型对测试集中的样本进行分类,识别该领域知识库实体。
2.根据权利要求1所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,在所述步骤S20中,对训练集数据进行字嵌入处理,获得字嵌入矩阵,包括步骤:
在训练集中随机选取相关文件中的独立句子作为输入,通过预处理构建字表,将句子转化为高维独热编码矩阵,传入字嵌入层;字嵌入层将独热编码矩阵映射为压缩的低维字嵌入矩阵。
3.根据权利要求1所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,所述字粒度命名实体识别模块采用BiLSTM层和CRF层,预测标签序列并标定标签序列,实现字粒度的序列标记任务。
4.根据权利要求3所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,所述全局粒度实体数量预测模块采用BiLSTM结合注意力层,预测实体数量并标定实体数量,实现句子全局粒度的命名实体数量预测任务。
5.根据权利要求1所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,任意选择两个不在测试集中的文件,对于选中的文件进行分词,对分词结果进行人工标注,构建开发集,利用开发集对模型进行优化。
6.根据权利要求5所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,在模型优化的过程中,所述字粒度命名实体识别模块包括步骤:
S311,接收字嵌入矩阵,通过捕捉前后文语义信息,初步获取命名实体识别任务的标签预测概率;
S312,以命名实体识别双向长短记忆网络层的输出为发射矩阵,通过状态转移矩阵进一步修正命名实体识别任务的标签预测概率;
S313,根据分类结果和人工标注结果,计算命名实体识别在开发集上的损失函数值,采取log似然,损失函数值计算公式为:
其中,PRealPath为在给定观测序列x的条件下真实的目标序列的概率;P1-Pn为在给定观测序列x的条件下,预测目标序列yn的概率。
7.根据权利要求6所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,在模型优化的过程中,所述全局粒度实体数量预测模块包括步骤:
S321,接收字嵌入矩阵,通过捕捉前后向语义信息,进一步获取句子的语义特征;
S322,接收实体数量预测双向长短记忆网络层的输出特征矩阵,通过注意力机制获取句子的全局的重要特征信息,最终预测出该句子中包含的实体数量;
S323,根据分类结果和人工标注结果,计算实体数量预测在开发集上的损失函数值,采取交叉熵损失,损失函数值计算公式为:
其中,y为实体数量标定类别张量,为实体数量预测概率张量。
8.根据权利要求7所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,命名实体识别的损失函数Loss1采取log似然,实体数量预测的损失函数Loss2采取交叉熵损失,通过系数d将Loss1与Loss2联合,得到最终模型优化目标:Loss=Loss1+d*Loss2。
9.根据权利要求8所述的一种基于多粒度认知的领域知识库实体识别方法,其特征在于,所述系数d为超参数,通过建立验证集进行调整。
CN202111213071.6A 2021-10-19 2021-10-19 一种基于多粒度认知的领域知识库实体识别方法 Active CN113886602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111213071.6A CN113886602B (zh) 2021-10-19 2021-10-19 一种基于多粒度认知的领域知识库实体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111213071.6A CN113886602B (zh) 2021-10-19 2021-10-19 一种基于多粒度认知的领域知识库实体识别方法

Publications (2)

Publication Number Publication Date
CN113886602A CN113886602A (zh) 2022-01-04
CN113886602B true CN113886602B (zh) 2023-08-01

Family

ID=79003617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111213071.6A Active CN113886602B (zh) 2021-10-19 2021-10-19 一种基于多粒度认知的领域知识库实体识别方法

Country Status (1)

Country Link
CN (1) CN113886602B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829678A (zh) * 2018-06-20 2018-11-16 广东外语外贸大学 一种汉语国际教育领域命名实体识别方法
CN111709240A (zh) * 2020-05-14 2020-09-25 腾讯科技(武汉)有限公司 实体关系抽取方法、装置、设备及其存储介质
CN113254602A (zh) * 2021-07-06 2021-08-13 北京邮电大学 面向科技政策领域的知识图谱构建方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597970B (zh) * 2019-08-19 2023-04-07 华东理工大学 一种多粒度医疗实体联合识别的方法及装置
CN110705293A (zh) * 2019-08-23 2020-01-17 中国科学院苏州生物医学工程技术研究所 基于预训练语言模型的电子病历文本命名实体识别方法
CN111259134B (zh) * 2020-01-19 2023-08-08 出门问问信息科技有限公司 一种实体识别方法、设备及计算机可读存储介质
CN111274820B (zh) * 2020-02-20 2023-04-07 齐鲁工业大学 一种基于神经网络的智能医疗命名实体识别方法和装置
CN112001171A (zh) * 2020-08-17 2020-11-27 四川大学 一种基于集成学习的涉案财物知识库实体识别方法
CN113128229B (zh) * 2021-04-14 2023-07-18 河海大学 一种中文实体关系联合抽取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108829678A (zh) * 2018-06-20 2018-11-16 广东外语外贸大学 一种汉语国际教育领域命名实体识别方法
CN111709240A (zh) * 2020-05-14 2020-09-25 腾讯科技(武汉)有限公司 实体关系抽取方法、装置、设备及其存储介质
CN113254602A (zh) * 2021-07-06 2021-08-13 北京邮电大学 面向科技政策领域的知识图谱构建方法及系统

Also Published As

Publication number Publication date
CN113886602A (zh) 2022-01-04

Similar Documents

Publication Publication Date Title
CN110309331B (zh) 一种基于自监督的跨模态深度哈希检索方法
CN112819023B (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN109189943B (zh) 一种能力知识抽取及能力知识图谱构建的方法
CN113821670B (zh) 图像检索方法、装置、设备及计算机可读存储介质
CN114896388A (zh) 一种基于混合注意力的层级多标签文本分类方法
CN110888980A (zh) 基于知识增强的注意力神经网络的隐式篇章关系识别方法
CN113626589B (zh) 一种基于混合注意力机制的多标签文本分类方法
CN110633365A (zh) 一种基于词向量的层次多标签文本分类方法及系统
CN113051914A (zh) 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
CN111581368A (zh) 一种基于卷积神经网络的面向智能专家推荐的用户画像方法
CN116304745B (zh) 基于深层次语义信息的文本话题匹配方法及系统
CN113064995A (zh) 一种基于图深度学习的文本多标签分类方法和系统
CN115687610A (zh) 文本意图分类模型训练方法、识别方法、装置、电子设备及存储介质
CN116049397A (zh) 基于多模态融合的敏感信息发现并自动分类分级方法
CN116484024A (zh) 一种基于知识图谱的多层次知识库构建方法
CN112612884B (zh) 一种基于公共文本的实体标签自动化标注方法
CN113657473A (zh) 一种基于迁移学习的Web服务分类方法
CN115797795B (zh) 基于强化学习的遥感影像问答式检索系统及方法
CN116992880A (zh) 建筑物名称的识别方法、装置、电子设备和存储介质
CN117077071A (zh) 一种基于数据分级的数据分析方法及系统
CN113886602B (zh) 一种基于多粒度认知的领域知识库实体识别方法
CN116975743A (zh) 行业信息分类方法、装置、计算机设备和存储介质
CN116680407A (zh) 一种知识图谱的构建方法及装置
CN116561272A (zh) 开放域视觉语言问答方法、装置、电子设备及存储介质
CN114842301A (zh) 一种图像注释模型的半监督训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant