CN112347150B - 一种学者学术标签标注方法、装置和电子设备 - Google Patents

一种学者学术标签标注方法、装置和电子设备 Download PDF

Info

Publication number
CN112347150B
CN112347150B CN202011321819.XA CN202011321819A CN112347150B CN 112347150 B CN112347150 B CN 112347150B CN 202011321819 A CN202011321819 A CN 202011321819A CN 112347150 B CN112347150 B CN 112347150B
Authority
CN
China
Prior art keywords
vector
label
representative data
layer
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011321819.XA
Other languages
English (en)
Other versions
CN112347150A (zh
Inventor
史小文
张鹏
唐杰
刘德兵
仇瑜
罗干
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhipu Huazhang Technology Co ltd
Original Assignee
Beijing Zhipu Huazhang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhipu Huazhang Technology Co Ltd filed Critical Beijing Zhipu Huazhang Technology Co Ltd
Priority to CN202011321819.XA priority Critical patent/CN112347150B/zh
Publication of CN112347150A publication Critical patent/CN112347150A/zh
Application granted granted Critical
Publication of CN112347150B publication Critical patent/CN112347150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种学者学术标签标注方法、装置和电子设备。该方法包括:首先从多种数据源中使用多种筛选规则筛选出代表性数据,然后将所有的代表性数据输入标签模型中,对每个代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签。通过采用多个筛选规则选取输入,提高了标注准确率;利用标签模型首先对各代表性的数据分别提取特征,再对提取到的多个特征进行特征融合,使最后提取的特征不仅包含所研究的主要的领域,还包含这些领域在学者研究生涯中的重要程度信息;另外,学者学术标签标注过程中融合了多种数据源的信息,所以,可以使模型能够全面准确的标注学者研究领域。

Description

一种学者学术标签标注方法、装置和电子设备
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种学者学术标签标注方法、装置和电子设备。
背景技术
为学者标注领域标签的方法有很多,其中以深度学习为核心算法的标签系统已经成为主流的智能化工具。基于深度学习的标签系统,是一种文本多标签分类模型。简单的做法是通过RNN,CNN等神经网络模型提取文本序列特征或者上下文特征,输出表示特征的向量表示,为下游其它任务作的特征化及向量化的工程。例如后续的分类任务,文本相似度任务等。
近些年,为了,更有针对性的解决实际问题,从而能够更有效更准确的利用神经网络进行性特征抽取和表示。产生了许多结构复杂,特点鲜明的神经网络模型,并且在这些模型的基础上又不断的衍生出新的网络结构。
但是这些算法模型普遍都是将学者的论文或者某一段或多段描述性文本组合在一起作为输入,这种方式的弊端是只采用了论文或者关键词等单一数据源,而且在这些算法中,大多是多篇论文文本组合为一个文本作为模型输入,这种方式会使得不同领域的文本混合后在模型计算特征时,原文本的特征词可能会因为混入交叉领域的文本而导致特征的权重被减弱,导致标注的准确性必然有欠缺,不能准确的解决学者多领域文本特征提取的问题。
发明内容
为了解决现有技术中存在的问题,本发明提供了如下技术方案。
本发明一方面提供了一种学者学术标签标注方法,包括:
采用预设的多个筛选规则,从每种数据源中筛选出待标注学者的多个代表性数据;
将所有的所述代表性数据输入标签模型中,对每个所述代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签。
优选地,所述数据包括论文、专利、科研项目和关键词。
优选地,所述对每个所述代表性数据分别进行特征提取,具体为:对每个所述代表性数据并行进行特征提取。
优选地,所述标签模型包括:
输入层,用于输入所有的所述代表性数据;
文本向量层,用于对输入的每个所述代表性数据分别进行编码,生成对应的文本向量;
局部注意力层,用于利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量;
全局注意力层,用于对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量;
特征提取层,用于对所述全局注意力向量进行特征提取,得到深度提取特征;
标签分类层,用于对所述深度提取特征进行分类计算,得到各深度提取特征的概率值;
输出层,用于根据各深度提取特征的概率值计算对应的标签并输出。
优选地,所述对输入的每个所述代表性数据分别进行编码,具体为,对输入的每个所述代表性数据并行进行编码。
优选地,所述利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量,包括:
利用局部注意力机制对文本向量中的每个维度按照对所属文本重要程度进行计算;
将计算结果进行线性变换生成局部注意力向量。
优选地,对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量,包括:
将所有的局部注意力向量进行拼接形成组合向量;
利用全局注意力机制计算各文本向量与组合向量的重要程度的比例;
按照得到的比例对各文本向量进行缩放,得到全局注意力向量。
本发明第二方面提供了一种学者学术标签标注装置,包括:
数据筛选模块,用于采用预设的多个筛选规则,从每种数据源中筛选出待标注学者的多个代表性数据;
学术标签生成模块,用于将所有的所述代表性数据输入标签模型中,对每个所述代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签。
本发明第三方面提供了一种存储器,存储有多条指令,所述指令用于实现如上述的方法。
本发明还提供了一种电子设备,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如上述的方法。
本发明的有益效果是:本发明提供的技术方案中,首先从多种数据源中使用多种筛选规则筛选出代表性数据,然后将所有的代表性数据输入标签模型中,对每个代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签。本发明中,通过采用多个专业总结的筛选规则,选取具有代表性的数据作为标签模型的输入,从而提高了标注准确率;利用标签模型首先对各代表性的数据分别提取特征,再对提取到的多个特征进行特征融合,从而使最后提取的特征不仅包含所研究的主要的领域,还包含这些领域在学者研究生涯中的重要程度信息;另外,标签模型的输入来自多种数据源,学者学术标签标注过程中融合了多种数据源的信息,所以,可以使模型能够全面准确的标注学者研究领域。
附图说明
图1为本发明所述学者学术标签标注方法流程示意图;
图2为本发明所述标签模型结构示意图;
图3为本发明所述标签模型工作过程示意图;
图4为本发明所述学者学术标签标注装置结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
本发明提供的方法可以在如下的终端环境中实施,该终端可以包括一个或多个如下部件:处理器、存储器和显示屏。其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现下述实施例所述的方法。
处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据。
存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。存储器可用于存储指令、程序、代码、代码集或指令。
显示屏用于显示各个应用程序的用户界面。
除此之外,本领域技术人员可以理解,上述终端的结构并不构成对终端的限定,终端可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、电源等部件,在此不再赘述。
实施例一
如图1所示,本发明实施例提供了一种学者学术标签标注方法,包括:
S101,采用预设的多个筛选规则,从每种数据源中筛选出待标注学者的多个代表性数据;
学者发表的论文数量巨大,知名学者甚至可能达到上千篇,现有的学者学术标签标注方法中,学者代表性数据的筛选方法大多方法采用单一的筛选规则,所以选取的数据不能很准确或者全面的代表学者的学术领域。另外,目前大部分的学者标注工具都是采用学者论文这个单一的数据源作为标注的分析依据。而实际上学者的研究成果除了通过论文呈现外,还可能涉及到专利、科研项目等。
所以,为了使得对学者的研究领域标注的更加准确,本发明中,以不同的数据源作为分析依据,采用多个专业总结的筛选规则,选取具有代表性的数据作为标注模型输入,。采用多数据源融合技术,利用多种数据源:包括论文、专利、科研项目和关键词进行融合,从而使模型能够全面准确的标注学者研究领域。从不同的数据源筛选对应的代表性数据时,可以采用不同的规则,提高标注准确率。比如:对于论文类代表性数据的筛选,可以采用如下的规则:从输入的论文中挑选近10年,该学者是文章的第一作者或者第二作者,并且论文被引用数前10的文章;对于科研项目类代表性数据的筛选,可以采用如下的规则:从输入的科研项目中挑选项目经费前10的项目;对于专利类代表性数据的筛选,可以采用如下的规则:从输入的专利中挑选近10年,该学者是专利申请人或专利发明人中排第一或第二的10个专利;对于学术关键词类代表性数据的筛选,可以采用如下的规则:统计出该学者发表论文中的关键词数量,取前20个关键词。
在步骤S101中,得到代表性数据后,对其进行比如文本停用词、标点等的数据清洗。
S102,将所有的所述代表性数据输入标签模型中,对每个所述代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签。
其中,如图2所示,使用的标签模型包括:
输入层,用于输入所有的所述代表性数据;
文本向量层,用于对输入的每个所述代表性数据分别进行编码,生成对应的文本向量;
局部注意力层,用于利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量;
全局注意力层,用于对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量;
特征提取层,用于对所述全局注意力向量进行特征提取,得到深度提取特征;
标签分类层,用于对所述深度提取特征进行分类计算,得到各深度提取特征的概率值;
输出层,用于根据各深度提取特征的概率值计算对应的标签并输出。
如图3所示,执行步骤S102,将步骤S101中筛选出的各类所述代表性数据输入标签模型的输入层中。而且,各代表性数据并行的输入模型,比如,选取的代表性数据为10个,则该10个数据时相互独立的,并行输入模型。而且,在本发明中,代表性数据在全局注意力层处理之前都是相互独立的。这种处理方式,可以对于跨领域研究的学者的代表性数据分别进行处理,能够在底层避免因为多领域混合而导致特征提取准确率下降的问题。
在文本向量层,对输入的每个所述代表性数据分别进行编码,生成对应的文本向量。本发明中,使用Bert预训练模型进行文本的embedding。Bert模型是一个成熟的预训练模型,核心是transformer模型,采用该模型进行文本向量表示,能够快速的生成具有文本语义特征的向量表示。而且,本发明中,对输入的每个所述代表性数据并行进行编码。
在局部注意力(attention)层,利用注意力机制对每个输入文本向量分别做特征的提取,生成对应的局部注意力向量。本发明中,各代表性数据的特征提取可以同时并行进行。特征提取过程包括:
利用局部注意力机制对文本向量中的每个维度按照对所属文本重要程度进行计算;
将计算结果进行线性变换生成局部注意力向量。
在全局注意力(attention)层,将所有的局部注意力向量进行拼接形成组合向量;
利用全局注意力机制计算各文本向量与组合向量的重要程度的比例;
按照得到的比例对各文本向量进行缩放,得到全局注意力向量。
所以,在全局注意力层,将局部注意力层提取到的各代表性数据特征进行了融合。
在特征提取层,全局注意力向量经过多层的线性变换,进行向量特征的更加抽象的深度提取。本发明中,可以利用普通的深度网络进行文本特征的深度提取。
在标签分类层,本发明中,可以利用感知机分类模型对深度提取特征进行分类计算,得到各深度提取特征的概率值。
在输出层输出相应标签,完成待标注学者的学术标签的标注。
实施例二
如图2所示,本发明的另一方面还包括和前述方法流程完全对应一致的功能模块架构,即本发明实施例还提供了学者学术标签标注装置,包括:
数据筛选模块401,用于采用预设的多个筛选规则,从每种数据源中筛选出待标注学者的多个代表性数据;
学术标签生成模块402,用于将所有的所述代表性数据输入标签模型中,对每个所述代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签。
所述数据包括论文、专利、科研项目和关键词。
其中,所述对每个所述代表性数据分别进行特征提取,具体为:对每个所述代表性数据并行进行特征提取。
本实施例中,所述标签模型包括:
输入层,用于输入所有的所述代表性数据;
文本向量层,用于对输入的每个所述代表性数据分别进行编码,生成对应的文本向量;
局部注意力层,用于利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量;
全局注意力层,用于对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量;
特征提取层,用于对所述全局注意力向量进行特征提取,得到深度提取特征;
标签分类层,用于对所述深度提取特征进行分类计算,得到各深度提取特征的概率值;
输出层,用于根据各深度提取特征的概率值计算对应的标签并输出。
进一步地,所述对输入的每个所述代表性数据分别进行编码,具体为,对输入的每个所述代表性数据并行进行编码。
本实施例中,所述利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量,包括:
利用局部注意力机制对文本向量中的每个维度按照对所属文本重要程度进行计算;
将计算结果进行线性变换生成局部注意力向量。
进一步地,对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量,包括:
将所有的局部注意力向量进行拼接形成组合向量;
利用全局注意力机制计算各文本向量与组合向量的重要程度的比例;
按照得到的比例对各文本向量进行缩放,得到全局注意力向量。
该装置可通过上述实施例一提供的学者学术标签标注方法实现,具体的实现方法可参见实施例一中的描述,在此不再赘述。
本发明还提供了一种存储器,存储有多条指令,所述指令用于实现如实施例一所述的方法。
本发明还提供了一种电子设备,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如实施例一所述的方法。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种学者学术标签标注方法,其特征在于,包括:
采用预设的多个筛选规则,从每种数据源中筛选出待标注学者的多个代表性数据;
将所有的所述代表性数据输入标签模型中,对每个所述代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签;
所述标签模型包括:
输入层,用于输入所有的所述代表性数据;
文本向量层,用于对输入的每个所述代表性数据分别进行编码,生成对应的文本向量;
局部注意力层,用于利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量;
全局注意力层,用于对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量;
特征提取层,用于对所述全局注意力向量进行特征提取,得到深度提取特征;
标签分类层,用于对所述深度提取特征进行分类计算,得到各深度提取特征的概率值;
输出层,用于根据各深度提取特征的概率值计算对应的标签并输出。
2.如权利要求1所述的学者学术标签标注方法,其特征在于,所述数据包括论文、专利、科研项目和关键词。
3.如权利要求1所述的学者学术标签标注方法,其特征在于,所述对每个所述代表性数据分别进行特征提取,具体为:对每个所述代表性数据并行进行特征提取。
4.如权利要求1所述的学者学术标签标注方法,其特征在于,所述对输入的每个所述代表性数据分别进行编码,具体为,对输入的每个所述代表性数据并行进行编码。
5.如权利要求1所述的学者学术标签标注方法,其特征在于,所述利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量,包括:
利用局部注意力机制对文本向量中的每个维度按照对所属文本重要程度进行计算;
将计算结果进行线性变换生成局部注意力向量。
6.如权利要求1所述的学者学术标签标注方法,其特征在于,对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量,包括:
将所有的局部注意力向量进行拼接形成组合向量;
利用全局注意力机制计算各文本向量与组合向量的重要程度的比例;
按照得到的比例对各文本向量进行缩放,得到全局注意力向量。
7.一种学者学术标签标注装置,其特征在于,包括:
数据筛选模块,用于采用预设的多个筛选规则,从每种数据源中筛选出待标注学者的多个代表性数据;
学术标签生成模块,用于将所有的所述代表性数据输入标签模型中,对每个所述代表性数据分别进行特征提取并对提取到的多个特征进行融合,输出所述待标注学者的学术标签;其中,所述标签模型包括:
输入层,用于输入所有的所述代表性数据;
文本向量层,用于对输入的每个所述代表性数据分别进行编码,生成对应的文本向量;
局部注意力层,用于利用局部注意力机制对每个所述文本向量进行特征提取,生成对应的局部注意力向量;
全局注意力层,用于对所有的局部注意力向量进行拼接并利用全局注意力机制进行特征提取,生成全局注意力向量;
特征提取层,用于对所述全局注意力向量进行特征提取,得到深度提取特征;
标签分类层,用于对所述深度提取特征进行分类计算,得到各深度提取特征的概率值;
输出层,用于根据各深度提取特征的概率值计算对应的标签并输出。
8.一种存储器,其特征在于,存储有多条指令,所述指令用于实现如权利要求1-6任一项所述的方法。
9.一种电子设备,其特征在于,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如权利要求1-6任一项所述的方法。
CN202011321819.XA 2020-11-23 2020-11-23 一种学者学术标签标注方法、装置和电子设备 Active CN112347150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011321819.XA CN112347150B (zh) 2020-11-23 2020-11-23 一种学者学术标签标注方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011321819.XA CN112347150B (zh) 2020-11-23 2020-11-23 一种学者学术标签标注方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112347150A CN112347150A (zh) 2021-02-09
CN112347150B true CN112347150B (zh) 2021-08-31

Family

ID=74365336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011321819.XA Active CN112347150B (zh) 2020-11-23 2020-11-23 一种学者学术标签标注方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112347150B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989790B (zh) * 2021-03-17 2023-02-28 中国科学院深圳先进技术研究院 基于深度学习的文献表征方法及装置、设备、存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664632A (zh) * 2018-05-15 2018-10-16 华南理工大学 一种基于卷积神经网络和注意力机制的文本情感分类算法
CN109255118A (zh) * 2017-07-11 2019-01-22 普天信息技术有限公司 一种关键词提取方法及装置
CN109522403A (zh) * 2018-11-05 2019-03-26 中山大学 一种基于融合编码的摘要文本生成方法
CN109902293A (zh) * 2019-01-30 2019-06-18 华南理工大学 一种基于局部与全局互注意力机制的文本分类方法
CN111291618A (zh) * 2020-01-13 2020-06-16 腾讯科技(深圳)有限公司 标注方法、装置、服务器和存储介质
CN111881262A (zh) * 2020-08-06 2020-11-03 重庆邮电大学 基于多通道神经网络的文本情感分析方法
CN111914097A (zh) * 2020-07-13 2020-11-10 吉林大学 基于注意力机制和多层级特征融合的实体抽取方法与装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8775570B2 (en) * 2011-09-15 2014-07-08 Hewlett-Packard Development Company, L. P. Geographic recommendation online search system
US10929607B2 (en) * 2018-02-22 2021-02-23 Salesforce.Com, Inc. Dialogue state tracking using a global-local encoder
CN111428026A (zh) * 2020-02-20 2020-07-17 西安电子科技大学 一种多标签文本分类处理方法及系统、信息数据处理终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255118A (zh) * 2017-07-11 2019-01-22 普天信息技术有限公司 一种关键词提取方法及装置
CN108664632A (zh) * 2018-05-15 2018-10-16 华南理工大学 一种基于卷积神经网络和注意力机制的文本情感分类算法
CN109522403A (zh) * 2018-11-05 2019-03-26 中山大学 一种基于融合编码的摘要文本生成方法
CN109902293A (zh) * 2019-01-30 2019-06-18 华南理工大学 一种基于局部与全局互注意力机制的文本分类方法
CN111291618A (zh) * 2020-01-13 2020-06-16 腾讯科技(深圳)有限公司 标注方法、装置、服务器和存储介质
CN111914097A (zh) * 2020-07-13 2020-11-10 吉林大学 基于注意力机制和多层级特征融合的实体抽取方法与装置
CN111881262A (zh) * 2020-08-06 2020-11-03 重庆邮电大学 基于多通道神经网络的文本情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于标签相似度计算的学术圈构建方法;傅城州 等;《计算机科学》;20160915;正文2.1小节 *

Also Published As

Publication number Publication date
CN112347150A (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN112632385B (zh) 课程推荐方法、装置、计算机设备及介质
US20170329755A1 (en) Method and apparatus and computer device for automatic semantic annotation for an image
CN110851596A (zh) 文本分类方法、装置及计算机可读存储介质
CN108984530A (zh) 一种网络敏感内容的检测方法及检测系统
CN107943847A (zh) 企业关系提取方法、装置及存储介质
CN107247751B (zh) 基于lda主题模型的内容推荐方法
CN109948160B (zh) 短文本分类方法及装置
CN112115252B (zh) 智能辅助写作处理方法、装置、电子设备及存储介质
CN110334186A (zh) 数据查询方法、装置、计算机设备及计算机可读存储介质
CN113051914A (zh) 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
CN111666766A (zh) 数据处理方法、装置和设备
CN111368544A (zh) 命名实体识别方法及装置
CN114510570A (zh) 基于小样本语料的意图分类方法、装置及计算机设备
CN111859909B (zh) 一种语义场景一致性识别阅读机器人
CN115203338A (zh) 一种标签及标签实例推荐方法
CN115131698A (zh) 视频属性确定方法、装置、设备及存储介质
CN116737922A (zh) 一种游客在线评论细粒度情感分析方法和系统
CN115392237A (zh) 情感分析模型训练方法、装置、设备及存储介质
CN112347150B (zh) 一种学者学术标签标注方法、装置和电子设备
CN113312924A (zh) 一种基于nlp高精解析标签的风险规则分类方法及装置
CN110309355A (zh) 内容标签的生成方法、装置、设备及存储介质
CN117077679A (zh) 命名实体识别方法和装置
CN114970553B (zh) 基于大规模无标注语料的情报分析方法、装置及电子设备
CN116719915A (zh) 智能问答方法、装置、设备及存储介质
CN115658885A (zh) 文本智能标注方法、系统、智能终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210323

Address after: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant after: Beijing innovation Zhiyuan Technology Co.,Ltd.

Address before: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant before: Beijing Zhiyuan Artificial Intelligence Research Institute

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210625

Address after: 603a, 6th floor, building 6, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant after: Beijing Zhipu Huazhang Technology Co.,Ltd.

Address before: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant before: Beijing innovation Zhiyuan Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Shi Xiaowen

Inventor after: Zhang Peng

Inventor after: Liu Debing

Inventor after: Chou Yu

Inventor after: Luo Gan

Inventor before: Shi Xiaowen

Inventor before: Zhang Peng

Inventor before: Tang Jie

Inventor before: Liu Debing

Inventor before: Chou Yu

Inventor before: Luo Gan

CB03 Change of inventor or designer information