CN110362673B - 基于摘要语义分析的计算机视觉类论文内容判别方法及系统 - Google Patents

基于摘要语义分析的计算机视觉类论文内容判别方法及系统 Download PDF

Info

Publication number
CN110362673B
CN110362673B CN201910644291.0A CN201910644291A CN110362673B CN 110362673 B CN110362673 B CN 110362673B CN 201910644291 A CN201910644291 A CN 201910644291A CN 110362673 B CN110362673 B CN 110362673B
Authority
CN
China
Prior art keywords
word
thesis
research field
extracting
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910644291.0A
Other languages
English (en)
Other versions
CN110362673A (zh
Inventor
陈星�
郭晨皓
李鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201910644291.0A priority Critical patent/CN110362673B/zh
Publication of CN110362673A publication Critical patent/CN110362673A/zh
Application granted granted Critical
Publication of CN110362673B publication Critical patent/CN110362673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于摘要语义分析的计算机视觉类论文内容判别方法及系统。该方法包括:针对输入的计算机视觉类论文的摘要进行预处理,并根据预处理结果完成机器学习模型结构名称的提取;提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重,统计单词集合中每一个词表中的得分,最大的得分对应的类别即为研究领域类别;根据得到的关键词组构建备选关键词组集,根据确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高得分的即为概述摘要的目标关键词组。本发明能够实现计算机视觉类论文内容的判别。

Description

基于摘要语义分析的计算机视觉类论文内容判别方法及系统
技术领域
本发明属于自然语言处理领域,具体涉及一种基于摘要语义分析的计算机视觉类论文内容判别方法及系统。
背景技术
随着大数据和机器学习等计算机技术近几年引发的巨大关注以及取得的令人瞩目的成果,含有更多隐藏层具有更加复杂的网络结构被提出,能够比传统的机器学习方法更具有强大有效的特征学习和特征表达能力。同时,为计算机视觉领域的研究提供了更多的思路和方法,在目标检测、目标跟踪、超分辨率、图片生成、3D建模和人体姿态相关等方向都有了广泛的应用,并取得了令人欣喜的实验结果。
由此,产生了如何根据所遇到的问题,快速找到所需要的模型,或者根据已知模型,找到对应解决的问题的需求。
为了满足这样的需求,就希望能对计算机论文进行应用类型的判别以及自动文本摘要,利用自然语言处理的技术提取出论文的简练结构化信息。而根据计算机视觉类论文的特点,在论文的摘要部分常常会存在着能够给予读者快速理解论文主要工作以及贡献的有价值的关键信息。
于是根据计算机视觉类论文的摘要,通过自然语言处理的分词、句法语法分析等技术,对文本进行内容判别和自动文本摘要等操作,获得我们希望提取的信息就成了一个值得试验的思路。
根据上述的思路,对六个特定类别的计算机视觉类论文:目标检测、目标跟踪、超分辨率相关、图片生成、3D建模和人体姿态相关,针对其摘要进行摘要中机器学习模型名称的提取,实现基于摘要的论文研究领域判别以及概述摘要的关键词组抽取模型。
发明内容
本发明的目的在于提供一种基于摘要语义分析的计算机视觉类论文内容判别方法及系统,能够实现计算机视觉类论文内容的判别。
为实现上述目的,本发明的技术方案是:一种基于摘要语义分析的计算机视觉类论文内容判别方法,包括如下步骤:
步骤S1、针对输入的计算机视觉类论文的摘要进行预处理,而后,根据预处理结果完成机器学习模型结构名称的提取;
步骤S2、首先,提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;而后,设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重,统计单词集合中每一个词表中的得分,最大的得分对应的类别即为研究领域类别;
步骤S3、根据步骤S2得到的关键词组构建备选关键词组集,而后,根据步骤S2确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高得分的即为概述摘要的目标关键词组。
在本发明一实施例中,所述步骤S1具体实现如下:
步骤S11、预处理:针对输入的计算机视觉类论文的摘要进行预处理,包括将段落形式的摘要切分成句子,再将句子由自然语言处理工具corenlp进行分词和依存分析的操作;
步骤S12、构建基于依存树的名称关键词提取模型:根据分词的结果顺序排列的词列表和依存分析的结果依存树,以关键词'network','Network','NETWORK'为起点向前回溯查找依存关系为amod,numod,det,acomp,nmod且父节点为关键词的词语加入代表机器学习模型结构名称的词列表中,完成机器学习模型结构名称的提取。
在本发明一实施例中,所述步骤S2具体实现如下:
步骤S21、提取关键词组,设计八种提取模型及其对应的触发模型的关键词:
提取模型一:首句主语,首句依存树的根节点的依存对象即是句子的主语;
提取模型二:关键词及其依存为修饰关系的词语;
提取模型三:关键词由case/mark 关系关联的目标短语;
提取模型四:及物动词关键词的直接宾语;
提取模型五:修饰动词关键词直接宾语的从句作为目标词组;
提取模型六:for引导的短语作为目标短语;
提取模型七:根节点为及物动词引导的宾语作为目标短语;
提取模型八: 根节点为非及物动词引导的宾语或动词短语作为目标短语;
而后,将提取到的关键词组中的所有词都加入一个单词集合,集合中单词不重复;
步骤S22、判别研究领域:设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重,统计步骤S21得到的单词集合在每一个词表中的得分,最大的得分对应的类别即为研究领域类别。
在本发明一实施例中,所述步骤S3具体实现如下:
步骤S31、构建备选关键词组集:根据步骤S22中关键词组构建备选关键词组集;
步骤S32、判别目标词组:由步骤S22中确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高的即为本模块抽取的目标词组。
本发明还提供了一种基于摘要语义分析的计算机视觉类论文内容判别系统,包括:
机器学习模型结构名称的提取模块,针对输入的计算机视觉类论文的摘要进行预处理,而后,根据预处理结果完成机器学习模型结构名称的提取;
论文研究领域判别器模块,提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;而后,设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重,统计单词集合中每一个词表中的得分,最大的得分对应的类别即为研究领域类别;
摘要概述的关键词组抽取模块,根据论文研究领域判别器模块得到的关键词组构建备选关键词组集,而后,根据论文研究领域判别器模块确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高得分的即为概述摘要的目标关键词组。
在本发明一实施例中,所述机器学习模型结构名称的提取模块,具体实现如下:
预处理:针对输入的计算机视觉类论文的摘要进行预处理,包括将段落形式的摘要切分成句子,再将句子由自然语言处理工具corenlp进行分词和依存分析的操作;
构建基于依存树的名称关键词提取模型:根据分词的结果顺序排列的词列表和依存分析的结果依存树,以关键词'network','Network','NETWORK'为起点向前回溯查找依存关系为amod,numod,det,acomp,nmod且父节点为关键词的词语加入代表机器学习模型结构名称的词列表中,完成机器学习模型结构名称的提取。
在本发明一实施例中,所述论文研究领域判别器模块,具体实现如下:
提取关键词组,设计八种提取模型及其对应的触发模型的关键词:
提取模型一:首句主语,首句依存树的根节点的依存对象即是句子的主语;
提取模型二:关键词及其依存为修饰关系的词语;
提取模型三:关键词由case/mark 关系关联的目标短语;
提取模型四:及物动词关键词的直接宾语;
提取模型五:修饰动词关键词直接宾语的从句作为目标词组;
提取模型六:for引导的短语作为目标短语;
提取模型七:根节点为及物动词引导的宾语作为目标短语;
提取模型八: 根节点为非及物动词引导的宾语或动词短语作为目标短语;
而后,将提取到的关键词组中的所有词都加入一个单词集合,集合中单词不重复;
判别研究领域:设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重,统计上述得到的单词集合在每一个词表中的得分,最大的得分对应的类别即为研究领域类别。
在本发明一实施例中,所述摘要概述的关键词组抽取模块,具体实现如下:
构建备选关键词组集:根据论文研究领域判别器模块得到关键词组构建备选关键词组集;
判别目标词组:由论文研究领域判别器模块确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高的即为本模块抽取的目标词组。
相较于现有技术,本发明具有以下有益效果:本发明能够实现计算机视觉类论文内容的判别。
附图说明
图1为本发明基于摘要语义分析的计算机视觉类论文内容判别流程图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明提供了一种基于摘要语义分析的计算机视觉类论文内容判别方法,包括如下步骤:
步骤S1、针对输入的计算机视觉类论文的摘要进行预处理,而后,根据预处理结果完成机器学习模型结构名称的提取;
步骤S2、首先,提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;而后,设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重,统计单词集合中每一个词表中的得分,最大的得分对应的类别即为研究领域类别;
步骤S3、根据步骤S2得到的关键词组构建备选关键词组集,而后,根据步骤S2确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高得分的即为概述摘要的目标关键词组。
以下为本发明的具体实现过程。
1、基于摘要语义分析的计算机视觉类论文内容判别的方法概览
图1给出了基于摘要语义分析的计算机视觉类论文内容判别技术的方法概览。该系统以计算机视觉类论文摘要为输入,通过系统中三个模块:机器学习模型结构名称的提取模块,论文研究领域判别器模块,摘要概述的关键词组抽取模块,分别提取出机器学习模型结构名称,论文的研究领域还有概述论文的关键词组。
2、工作流程
2.1、机器学习模型结构名称的提取模块
第一步,预处理。针对输入进系统的计算机视觉类论文的摘要进行预处理,主要包括把段落形式的摘要切分成句子,再将句子由自然语言处理工具corenlp进行分词和依存分析的操作。
第二步,构建基于依存树的名称关键词提取模型。根据分词的结果顺序排列的词列表和依存分析的结果依存树,以关键词'network','Network','NETWORK',为起点向前回溯查找依存关系为amod,numod,det,acomp,nmod且父节点为关键词的词语加入代表机器学习模型结构名称的词列表中,完成器学习模型结构名称的提取。
2.2、论文研究领域判别器模块
第一步,提取关键词组,设计八种提取模型及其对应的触发模型的关键词:
提取模型一:首句主语,首句依存树的根节点的依存对象即是句子的主语。
提取模型二:关键词及其依存为修饰关系的词语,以特定关键词为出发条件向前向后获取修饰型依存关系的词组成词组。
提取模型三:关键词由case/mark 关系关联的目标短语,适用于 the problem of这一类关键词后跟mark/case依存关系的句式,提取例句中of后的词组。
提取模型四:及物动词关键词的直接宾语,对于特定的动词关键词如improve这类及物动词,后面的之间宾语常代表文章的主要工作。
提取模型五:修饰动词关键词直接宾语的从句作为目标词组,适用于如“Wepropose something that/to …”这样由动词(propose)引导的的直接宾语的从句或动词修饰。
提取模型六:for引导的短语作为目标短语,for引导的短语常表示目的
提取模型七:根节点为及物动词引导的宾语作为目标短语,适用于类似“Wepropose something”,而句子中成分“something”即是目标词组的情况
提取模型八: 根节点为非及物动词引导的宾语或动词短语作为目标短语。使用于类似“We focus on something”,不同于模型七,本模型的动词是非及物动词,需要介词引导宾语。
将提取到的关键词组中的所有词都加入一个单词集合,集合中单词不重复。
第二步,判别研究领域。设计每一个研究领域类别设计单词表,并对每一个表中的每个单词设计权重。统计上一步得到的单词集合在每一个词表中的得分,最大的得分对应的类别即为研究领域的类别。
2.3、摘要概述的关键词组抽取模块
第一步,构建备选关键词组集。由2.2中关键词组的抽取当做这个模块的备选关键词组集。
第二步,判别目标词组。由2.2中确定的研究领域类别及其对应的词表和权重,对备选关键词组集中的所有词组进行计算得分,最高的即为本模块抽取的目标词组。
3、实施例
通过对72个样本的六个研究领域类别的测试结果如表1所示:
表1 测试结果
类别 准确率 召回率 F1值 论文数
1.目标检测 0.93 1.00 0.97 14
2.目标跟踪 1.00 0.73 0.84 11
3.超分辨率 0.81 0.93 0.87 14
4.图片生成 0.92 1.00 0.96 11
5.3D建模 1.00 0.70 0.82 10
6.人体姿态识别 1.00 1.00 1.00 12
平均/总计 0.94 0.90 0.91 72
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (4)

1.一种基于摘要语义分析的计算机视觉类论文内容判别方法,其特征在于,包括如下步骤:
步骤S1、针对输入的计算机视觉类论文的摘要进行预处理,而后,根据预处理结果完成机器学习模型结构名称的提取;
步骤S2、首先,提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;而后,为每一个研究领域类别设计单词表,并对每一个单词表中的每个单词设计权重,统计单词集合在每一个单词表中的得分,最大的得分对应的类别即为研究领域类别;
步骤S3、根据步骤S2得到的关键词组构建备选关键词组集,而后,根据步骤S2确定的研究领域类别及其对应的单词表和权重,对备选关键词组集中的所有词组计算得分,最高得分的关键词组即为概述摘要的目标关键词组;
所述步骤S1具体实现如下:
步骤S11、预处理:针对输入的计算机视觉类论文的摘要进行预处理,包括将段落形式的摘要切分成句子,再将句子由自然语言处理工具corenlp进行分词和依存分析的操作;
步骤S12、构建基于依存树的名称关键词提取模型:根据分词的结果顺序排列的词列表和依存分析的结果依存树,以关键词'network','Network','NETWORK'为起点向前回溯查找依存关系为amod,numod,det,acomp,nmod且父节点为关键词的词语加入代表机器学习模型结构名称的词列表中,完成机器学习模型结构名称的提取;
所述步骤S2具体实现如下:
步骤S21、提取关键词组,设计八种提取模型及其对应的触发模型的关键词:
提取模型一:首句主语,首句依存树的根节点的依存对象即是句子的主语;
提取模型二:关键词及其依存为修饰关系的词语;
提取模型三:关键词由case/mark 关系关联的目标短语;
提取模型四:及物动词关键词的直接宾语;
提取模型五:修饰动词关键词直接宾语的从句作为目标词组;
提取模型六:for引导的短语作为目标短语;
提取模型七:根节点为及物动词引导的宾语作为目标短语;
提取模型八:根节点为非及物动词引导的宾语或动词短语作为目标短语;
而后,将提取到的关键词组中的所有词都加入一个单词集合,集合中单词不重复;
步骤S22、判别研究领域:为每一个研究领域类别设计单词表,并对每一个单词表中的每个单词设计权重,统计步骤S21得到的单词集合在每一个单词表中的得分,最大的得分对应的类别即为研究领域类别。
2.根据权利要求1所述的一种基于摘要语义分析的计算机视觉类论文内容判别方法,其特征在于,所述步骤S3具体实现如下:
步骤S31、构建备选关键词组集:根据步骤S22中关键词组构建备选关键词组集;
步骤S32、判别目标关键词组:由步骤S22中确定的研究领域类别及其对应的单词表和权重,对备选关键词组集中的所有词组计算得分,最高得分的关键词组即为概述摘要抽取的目标关键词组。
3.一种基于摘要语义分析的计算机视觉类论文内容判别系统,其特征在于,包括:
机器学习模型结构名称的提取模块,针对输入的计算机视觉类论文的摘要进行预处理,而后,根据预处理结果完成机器学习模型结构名称的提取;
论文研究领域判别器模块,提取计算机视觉类论文的关键词组,并将提取到的关键词组中的所有词都加入一个单词集合;而后,为每一个研究领域类别设计单词表,并对每一个单词表中的每个单词设计权重,统计单词集合在每一个单词表中的得分,最大的得分对应的类别即为研究领域类别;
摘要概述的关键词组抽取模块,根据论文研究领域判别器模块得到的关键词组构建备选关键词组集,而后,根据论文研究领域判别器模块确定的研究领域类别及其对应的单词表和权重,对备选关键词组集中的所有词组计算得分,最高得分的关键词组即为概述摘要的目标关键词组;
所述机器学习模型结构名称的提取模块,具体实现如下:
预处理:针对输入的计算机视觉类论文的摘要进行预处理,包括将段落形式的摘要切分成句子,再将句子由自然语言处理工具corenlp进行分词和依存分析的操作;
构建基于依存树的名称关键词提取模型:根据分词的结果顺序排列的词列表和依存分析的结果依存树,以关键词'network','Network','NETWORK'为起点向前回溯查找依存关系为amod,numod,det,acomp,nmod且父节点为关键词的词语加入代表机器学习模型结构名称的词列表中,完成机器学习模型结构名称的提取;
所述论文研究领域判别器模块,具体实现如下:
提取关键词组,设计八种提取模型及其对应的触发模型的关键词:
提取模型一:首句主语,首句依存树的根节点的依存对象即是句子的主语;
提取模型二:关键词及其依存为修饰关系的词语;
提取模型三:关键词由case/mark 关系关联的目标短语;
提取模型四:及物动词关键词的直接宾语;
提取模型五:修饰动词关键词直接宾语的从句作为目标词组;
提取模型六:for引导的短语作为目标短语;
提取模型七:根节点为及物动词引导的宾语作为目标短语;
提取模型八: 根节点为非及物动词引导的宾语或动词短语作为目标短语;
而后,将提取到的关键词组中的所有词都加入一个单词集合,集合中单词不重复;
判别研究领域:为每一个研究领域类别设计单词表,并对每一个单词表中的每个单词设计权重,统计上述得到的单词集合在每一个单词表中的得分,最大的得分对应的类别即为研究领域类别。
4.根据权利要求3所述的一种基于摘要语义分析的计算机视觉类论文内容判别系统,其特征在于,所述摘要概述的关键词组抽取模块,具体实现如下:
构建备选关键词组集:根据论文研究领域判别器模块得到关键词组构建备选关键词组集;
判别目标关键词组:由论文研究领域判别器模块确定的研究领域类别及其对应的单词表和权重,对备选关键词组集中的所有词组计算得分,最高得分的关键词组即为概述摘要抽取的目标关键词组。
CN201910644291.0A 2019-07-17 2019-07-17 基于摘要语义分析的计算机视觉类论文内容判别方法及系统 Active CN110362673B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910644291.0A CN110362673B (zh) 2019-07-17 2019-07-17 基于摘要语义分析的计算机视觉类论文内容判别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910644291.0A CN110362673B (zh) 2019-07-17 2019-07-17 基于摘要语义分析的计算机视觉类论文内容判别方法及系统

Publications (2)

Publication Number Publication Date
CN110362673A CN110362673A (zh) 2019-10-22
CN110362673B true CN110362673B (zh) 2022-07-08

Family

ID=68220049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910644291.0A Active CN110362673B (zh) 2019-07-17 2019-07-17 基于摘要语义分析的计算机视觉类论文内容判别方法及系统

Country Status (1)

Country Link
CN (1) CN110362673B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765979B (zh) * 2021-01-15 2023-05-09 西华大学 论文关键词提取系统及其方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808524A (zh) * 2016-03-11 2016-07-27 江苏畅远信息科技有限公司 一种基于专利文献摘要的专利自动分类方法
CN109190017A (zh) * 2018-08-02 2019-01-11 腾讯科技(北京)有限公司 热点信息的确定方法、装置、服务器及存储介质
CN109241538A (zh) * 2018-09-26 2019-01-18 上海德拓信息技术股份有限公司 基于关键词和动词依存的中文实体关系抽取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1830281A1 (en) * 2004-11-05 2007-09-05 Intellectual Property Bank Corp. Keyword extracting device
US8131735B2 (en) * 2009-07-02 2012-03-06 Battelle Memorial Institute Rapid automatic keyword extraction for information retrieval and analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808524A (zh) * 2016-03-11 2016-07-27 江苏畅远信息科技有限公司 一种基于专利文献摘要的专利自动分类方法
CN109190017A (zh) * 2018-08-02 2019-01-11 腾讯科技(北京)有限公司 热点信息的确定方法、装置、服务器及存储介质
CN109241538A (zh) * 2018-09-26 2019-01-18 上海德拓信息技术股份有限公司 基于关键词和动词依存的中文实体关系抽取方法

Also Published As

Publication number Publication date
CN110362673A (zh) 2019-10-22

Similar Documents

Publication Publication Date Title
CN110442760B (zh) 一种问答检索系统的同义词挖掘方法及装置
CN109543178B (zh) 一种司法文本标签体系构建方法及系统
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN103399901B (zh) 一种关键词抽取方法
CN101655837B (zh) 一种对语音识别后文本进行检错并纠错的方法
CN106599032B (zh) 一种结合稀疏编码和结构感知机的文本事件抽取方法
CN109241538A (zh) 基于关键词和动词依存的中文实体关系抽取方法
CN108959258B (zh) 一种基于表示学习的特定领域集成实体链接方法
CN106257455B (zh) 一种基于依存关系模板抽取观点评价对象的Bootstrapping方法
CN101599071A (zh) 对话文本主题的自动提取方法
CN109002473A (zh) 一种基于词向量与词性的情感分析方法
CN110362678A (zh) 一种自动提取中文文本关键词的方法与装置
CN104317882B (zh) 一种决策级中文分词融合方法
CN103678287A (zh) 一种关键词翻译统一的方法
CN111428031B (zh) 一种融合浅层语义信息的图模型过滤方法
CN114491062B (zh) 一种融合知识图谱和主题模型的短文本分类方法
CN107239455B (zh) 核心词识别方法及装置
Saghayan et al. Exploring the impact of machine translation on fake news detection: A case study on persian tweets about covid-19
CN113515939B (zh) 一种勘察报告文本关键信息提取系统和提取方法
CN110362673B (zh) 基于摘要语义分析的计算机视觉类论文内容判别方法及系统
Ahmed et al. Question analysis for Arabic question answering systems
CN110705285B (zh) 一种政务文本主题词库构建方法、装置、服务器及可读存储介质
CN112528640A (zh) 一种基于异常子图检测的领域术语自动抽取方法
CN112632272A (zh) 基于句法分析的微博情感分类方法和系统
CN116662479A (zh) 一种用于医保目录的文本匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant