CN116069924A - 一种融合全局和局部语义特征的文本摘要生成方法及系统 - Google Patents
一种融合全局和局部语义特征的文本摘要生成方法及系统 Download PDFInfo
- Publication number
- CN116069924A CN116069924A CN202310096168.6A CN202310096168A CN116069924A CN 116069924 A CN116069924 A CN 116069924A CN 202310096168 A CN202310096168 A CN 202310096168A CN 116069924 A CN116069924 A CN 116069924A
- Authority
- CN
- China
- Prior art keywords
- text
- global
- semantic feature
- vector
- local semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 80
- 230000007246 mechanism Effects 0.000 claims abstract description 43
- 238000000605 extraction Methods 0.000 claims abstract description 42
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 230000004927 fusion Effects 0.000 claims abstract description 7
- 239000010410 layer Substances 0.000 claims description 28
- 238000013527 convolutional neural network Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000007476 Maximum Likelihood Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 238000003058 natural language processing Methods 0.000 abstract description 3
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013215 result calculation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种融合全局和局部语义特征的文本摘要生成方法及系统,属于自然语言处理技术领域。该方法包括:接收待生成摘要的文本,并进行预处理;将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;将其输入注意力机制中进行融合,得到上下文向量;根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要。本发明融合局部语义特征与全局语义特征,加强了生成摘要的准确性和模型对语义信息提取的能力;使用基于指针机制的解码器,同时从原文和词表中抽取词汇组成最终生成的摘要,解决文本摘要领域常见的词表外单词OOV问题。
Description
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种融合全局和局部语义特征的文本摘要生成方法及系统。
背景技术
随着互联网时代的发展,大量的信息包括图片、视频、文本等不断涌现在网络上,影响着人们的生活。然而,在人们享受着信息给我们带来便利的同时,信息超载的问题越来越常见,如何从大量的信息当中准确的提取出最主要的内容显得尤为重要。文本信息作为互联网上最为常见的信息形式之一,如何准确的帮助用户从海量文本信息中获取最主要的信息成为目前亟待解决的问题。
自动文本摘要技术是自然语言处理技术中的一个分支,在输入一长串的文本后,通过机器快速提取出文本的主要内容并总结成摘要,可以帮助用户节省时间并提高阅读效率。目前自动文本摘要技术已经在许多领域诸如新闻标题生成、关键信息检索和舆情检测等领域得到了广泛的应用。
根据自动文本摘要的生成方式,可将其分为抽取式文本摘要和抽象式文本摘要。抽取式文本摘要通过直接从原文本中抽取词语和句子组成最终生成的摘要,此方法在摘要生成的句子可读性和流畅性等方面有着较好的表现。抽象式文本摘要通过从建立的词表中抽取单词组成最终生成的摘要,随着近些年深度学习的发展,抽象式文本摘要在语句生成的准确率和可读性方面均有着较好的发展。与此同时,摘要生成方法依旧存在着许多问题,诸如语义表达不清和词表外单词(out of vocabulary,OOV)等问题亟待解决
发明内容
为了解决当前技术中存在的缺陷,本发明引入卷积神经网络加强对文本全局语义特征的提取,并通过keybert关键词提取器和多头自注意力机制提取文本局部语义特征,提升传统模型的整体能力并解决摘要生成过程中语义表达不清和语义信息缺失等技术问题。
为了达到上述目的,本发明提供了一种融合全局和局部语义特征的文本摘要生成方法,包括如下步骤:
(1)接收待生成摘要的文本,并进行预处理;
(2)构建文本摘要生成模型,所述模型包括:全局语义特征提取模块和局部语义特征提取模块、注意力机制以及基于指针机制的解码层;
将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;
将所述全局语义特征向量和局部语义特征向量输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要;
(3)基于损失函数对模型进行训练,得到训练好的所述文本摘要生成模型;
(4)将经过步骤(1)处理后的待生成摘要的文本,输入训练好的所述文本摘要生成模型,生成文本摘要。
进一步的,所述预处理具体包括:
使用jieba分词器对文本进行分词处理;
去除无用的标签、特殊符号和停用词;
对于过长的所述文本进行截断处理。
进一步的,所述全局语义特征提取模块由卷积神经网络和单层双向的长短期序列网络组成,将卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的输出进行融合,得到全局语义特征向量;
所述局部语义特征提取模块由keybert关键词提取器和基于transformer的多头自注意力机制组成。
进一步的,将卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的输出进行融合具体为:
(2.1)所述预处理后的文本输入所述卷积神经网络CNN,计算公式如下:
mi=f(Wcxi:i+h-1+bc)
其中,h指的是卷积核的长度,xi:i+h-1表示所述预处理后的文本中从第i个词向量开始到h个词向量组成的矩阵,f表示非线性激活函数,bc为偏置项,Wc表示卷积核;
(2.2)所述预处理后的文本输入所述双向长短期记忆网络Bi-LSTM,计算公式如下:
(2.3)融合得到全局语义特征向量:
pi=hi+mi
其中:pi为全局语义特征向量。
进一步的,所述keybert关键词提取器具体过程如下:
首先使用BERT获取所述预处理后的文本的向量级表示,随后针对n元词组或短语与所述预处理后的文本向量进行相似度计算,根据结果查找出相似度最高的词组或短语,并将其作为关键词提取出来。
进一步的,所述transformer的多头自注意力机制具体过程如下:
所述关键词输入所述基于transformer的多头自注意力机制,根据所述关键词随机初始化Q、K、V三个初始化矩阵,得到注意力权重:
其中:d表示矩阵Q、K的维度;
并行处理多个注意力层并通过连接得到关键词向量K:
K=Concat(head1,head2,...,headn)Wo
其中,headi表示多头自注意力机制力中第i个注意力的输出,Wo,WQ,WK,WV为对应线性矩阵,K表示经过权重分配后的关键词向量。
进一步的,将所述全局语义特征向量和局部语义特征向量输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量计算过程为;
et,i=softmax(vTtanh(Whpi+Wsst+WkK+b))
αt,i=softmax(e′ti)
进一步的,所述基于指针机制的解码层计算方式如下:
其中:表示上下文向量,st为LSTM解码层t时刻状态,xt表示t时刻所述预处理后的文本词序列,σ表示sigmoid函数,P(w)代表最终生成单词的概率分布,Pvoc代表从词表中抽取单词的概率分布,1-Pgen代表从原文本中抽取单词的概率,b,V,bptr均为训练参数。
进一步的,所述损失函数采用极大似然估计算法。
本发明还提供了一种融合全局和局部语义特征的文本摘要生成系统,包括:
文本获取模块:用于接收待生成摘要的文本,并进行预处理;
特征提取模块:用于将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;并将其输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
生成模块:用于根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要。
本发明的有益效果:
1、全局语义特征提取模块增设了卷积神经网络CNN,提升了模型的全局语义特征提取能力和模型的整体能力。
2、引入局部语义特征提取模块,与全局语义特征提取模块的输出融合,加强了生成摘要的准确性和模型对语义信息提取的能力。
3、使用基于指针机制的解码器,用于同时从原文和词表中抽取词汇组成最终生成的摘要,解决文本摘要领域常见的词表外单词OOV问题。
附图说明
图1为本发明实施例融合全局和局部语义特征的文本摘要生成方法的流程示意图。
图2为本发明实施例文本摘要生成模型的结构示意图。
具体实施方式
下面结合附图及较佳实施例详细说明本发明的具体实施方式。
如图1所示,本发明实施例提供了一种融合全局和局部语义特征的文本摘要生成方法,包括以下步骤:
S101、接收待生成摘要的文本,并进行预处理;
使用jieba分词器对文本进行分词处理;
随后去除无用的标签、特殊符号和停用词;
最后对于过长的原文本进行截断处理,最大长度设置为100。
S102、构建文本摘要生成模型,所述模型包括:全局语义特征提取模块和局部语义特征提取模块、注意力机制以及基于指针机制的解码层;
如图2所示,构建文本摘要生成模型,具体如下:
(1)将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;
(1.1)全局语义特征提取模块
全局语义特征提取模块由单层双向长短期序列网络和卷积神经网络组成,原文本的输入用x={x1,x2,x3…xi}表示,其中xi表示原文本中第i个词,使用pytorch的nn.embedding模块进行词嵌入处理;
首先通过长短期序列神经网络Bi-LSTM输入模型并逐个成为编码器隐藏层状态hi,
同时,原文本从另一端输入CNN,其计算公式如下:
mi=f(Wcxi:i+h-1+bc)
其中,h指的是卷积核的长度,xi:i+h-1表示从第i个词向量开始到h个词向量组成的矩阵,f表示非线性激活函数,bc为偏置项,Wc表示卷积核。
将CNN和Bi-LSTM的输出结合,得到全局语义特征向量pi=hi+mi。
(1.2)局部语义特征提取模块
局部语义特征提取模块由keybert关键词提取器和基于transformer的多头自注意力机制组成。
keybert关键词提取器对原文本进行关键词提取包括:首先使用BERT提取原文本的向量级表示,随后基于n元词组将其与原文本进行相似度计算,本实施例基于余弦相似度计算公式:
simi=cos(xi,y)
其中:xi为n-gram的第i个词向量,y为原文本向量。
随后,根据得到的关键词信息,输入基于transformer的多头自注意力机制。根据关键词信息随机初始化Q、K、V三个初始化矩阵。经过Q、KT相乘后的一系列运算得到注意力权重,使用作为分母进行缩放,d表示输入矩阵Q、K的维度。经过矩阵相乘和缩放后经过softmax层再与矩阵V点积,得到注意力权重,计算权重Attention(Q、K、V)的公式如下:
在多头注意力机制中,通常并行处理多个注意力层并通过连接得到最后的输出,其中单个注意力机制和总的结果计算公式如下:
K=Concat(head1,head2,...,headn)Wo
其中,headi表示多头自注意力机制力中第i个注意力的输出,Wo,WQ,WK,WV为对应线性矩阵,对各个注意力的输出进行拼接,再经过线性操作得到经过权重分配后的关键词向量K。
(2)将所述全局语义特征向量和局部语义特征向量输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
具体融合全局和局部语义特征的注意力机制计算如下:
et,i=softmax(vTtanh(Whai+Wsst+WkK+b))
αt,i=softmax(e′ti)
(3)根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要;
基于指针机制的解码层计算方式如下:
其中,表示上下文向量,st为LSTM解码层t时刻状态,xt表示t时刻所述预处理后的文本词序列,σ表示sigmoid函数,P(w)代表最终生成单词的概率分布,Pvoc代表从词表中抽取单词的概率分布,1-Pgen代表从原文本中抽取单词的概率,b,V,bptr均为可训练参数。
S103、基于损失函数对模型进行训练,得到训练好的所述文本摘要生成模型;
本实施例采用极大似然估计(Maximum Likelihood Estimate,MLE)算法。MLE通过最大化序列到序列训练过程中的给定样本概率而得到,定义一篇文章的原文为x,生成的摘要为y={y1 *,y2 *,y3 *…},在训练中通过最小化以下损失函数来得到最佳结果:
其中,Lml表示基于MLE的损失函数。基于MLE的方法在训练过程中可以逐个通过与标准摘要的比对逐个进行单词生成。
公开评价指标使用ROUGE和人工评测方式,本方法在最终评测结果中基于现有的基础模型,实验结果表明,ROUGE-1,ROUGE-2和ROUGE-L均有一定程度的提升,准确率分别达到了47.87%,31.12%和45.71%,本方法在引入局部语义信息提取模块和全局语义信息提取模块后,摘要生成的结果有着较好的准确率。
S104、将经过步骤S101处理后的待生成摘要的文本,输入训练好的所述文本摘要生成模型,生成文本摘要。
本发明另一实施例还提供了一种融合全局和局部语义特征的文本摘要生成系统,包括:
文本获取模块:用于接收待生成摘要的文本,并进行预处理;
特征提取模块:用于将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;并将其输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
生成模块:用于根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要。
综上,本发明提出了一种融合局部语义信息和全局语义信息的文本摘要方法,并生成了融合局部语义信息和全局语义信息的摘要。基于指针机制的解码器通过从原文本和生成的词表中抽取单词组成最后的摘要,解决了常见的OOV问题。通过以上方法得到的摘要在语句的流畅性和关键词表达能力上有较好的效果。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,因此,本发明的保护范围由所附权利要求书限定。
Claims (10)
1.一种融合全局和局部语义特征的文本摘要生成方法,其特征在于,包括如下步骤:
(1)接收待生成摘要的文本,并进行预处理;
(2)构建文本摘要生成模型,所述模型包括:全局语义特征提取模块和局部语义特征提取模块、注意力机制以及基于指针机制的解码层;
将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;将所述全局语义特征向量和局部语义特征向量输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要;
(3)基于损失函数对模型进行训练,得到训练好的所述文本摘要生成模型;
(4)将经过步骤(1)处理后的待生成摘要的文本,输入训练好的所述文本摘要生成模型,生成文本摘要。
2.根据权利要求1所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,所述预处理具体包括:
使用jieba分词器对文本进行分词处理;
去除无用的标签、特殊符号和停用词;
对于过长的所述文本进行截断处理。
3.根据权利要求1所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于:
所述全局语义特征提取模块由卷积神经网络和单层双向的长短期序列网络组成,将卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的输出进行融合,得到全局语义特征向量;
所述局部语义特征提取模块由keybert关键词提取器和基于transformer的多头自注意力机制组成。
4.根据权利要求3所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,将卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的输出进行融合具体为:
(2.1)所述预处理后的文本输入所述卷积神经网络CNN,计算公式如下:
mi=f(Wcxi:h+h-1+bc)
其中,h指的是卷积核的长度,xi:i+h-1表示所述预处理后的文本中从第i个词向量开始到h个词向量组成的矩阵,f表示非线性激活函数,bc为偏置项,Wc表示卷积核;
(2.2)所述预处理后的文本输入所述双向长短期记忆网络Bi-LSTM,计算公式如下:
(2.3)融合得到全局语义特征向量:
pi=hi+mi
其中:pi为全局语义特征向量。
5.根据权利要求3所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,所述keybert关键词提取器具体过程如下:
首先使用BERT获取所述预处理后的文本的向量级表示,随后针对n元词组或短语与所述预处理后的文本向量进行相似度计算,根据结果查找出相似度最高的词组或短语,并将其作为关键词提取出来。
6.根据权利要求5所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,所述transformer的多头自注意力机制具体过程如下:
所述关键词输入所述基于transformer的多头自注意力机制,根据所述关键词随机初始化Q、K、V三个初始化矩阵,得到注意力权重:
其中:d表示矩阵Q、K的维度;
并行处理多个注意力层并通过连接得到关键词向量K:
headi=Attention(QWi Q,KWi K,VWi V)
K=Concat(head1,head2,...,headn)Wo
其中,headi表示多头自注意力机制力中第i个注意力的输出,Wo,WQ,WK,WV为对应线性矩阵,K表示经过权重分配后的关键词向量。
9.根据权利要求1所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,所述损失函数采用极大似然估计算法。
10.一种融合全局和局部语义特征的文本摘要生成系统,其特征在于,包括:
文本获取模块:用于接收待生成摘要的文本,并进行预处理;
特征提取模块:用于将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;并将其输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
生成模块:用于根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310096168.6A CN116069924A (zh) | 2023-02-10 | 2023-02-10 | 一种融合全局和局部语义特征的文本摘要生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310096168.6A CN116069924A (zh) | 2023-02-10 | 2023-02-10 | 一种融合全局和局部语义特征的文本摘要生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116069924A true CN116069924A (zh) | 2023-05-05 |
Family
ID=86174700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310096168.6A Pending CN116069924A (zh) | 2023-02-10 | 2023-02-10 | 一种融合全局和局部语义特征的文本摘要生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116069924A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117235121A (zh) * | 2023-11-15 | 2023-12-15 | 华北电力大学 | 一种能源大数据查询方法和系统 |
CN118362898A (zh) * | 2024-04-24 | 2024-07-19 | 苏州特瑞菲机械设备有限公司 | 新能源汽车电池性能检测系统及方法 |
-
2023
- 2023-02-10 CN CN202310096168.6A patent/CN116069924A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117235121A (zh) * | 2023-11-15 | 2023-12-15 | 华北电力大学 | 一种能源大数据查询方法和系统 |
CN117235121B (zh) * | 2023-11-15 | 2024-02-20 | 华北电力大学 | 一种能源大数据查询方法和系统 |
CN118362898A (zh) * | 2024-04-24 | 2024-07-19 | 苏州特瑞菲机械设备有限公司 | 新能源汽车电池性能检测系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560503B (zh) | 融合深度特征和时序模型的语义情感分析方法 | |
CN110119765B (zh) | 一种基于Seq2seq框架的关键词提取方法 | |
CN108460013B (zh) | 一种基于细粒度词表示模型的序列标注模型及方法 | |
CN109684648B (zh) | 一种多特征融合的古今汉语自动翻译方法 | |
CN110866399B (zh) | 一种基于增强字符向量的中文短文本实体识别与消歧方法 | |
Wang et al. | Transition-based disfluency detection using lstms | |
CN110413768B (zh) | 一种文章题目自动生成方法 | |
CN116069924A (zh) | 一种融合全局和局部语义特征的文本摘要生成方法及系统 | |
CN110619043A (zh) | 基于动态词向量的自动文本摘要生成方法 | |
CN109815476B (zh) | 一种基于中文语素和拼音联合统计的词向量表示方法 | |
CN111241816A (zh) | 一种新闻标题自动生成方法 | |
CN110781290A (zh) | 一种长篇章结构化文本摘要提取方法 | |
CN111401079A (zh) | 神经网络机器翻译模型的训练方法、装置及存储介质 | |
CN111061861A (zh) | 一种基于XLNet的文本摘要自动生成方法 | |
CN111984782B (zh) | 藏文文本摘要生成方法和系统 | |
Chen et al. | Extractive text-image summarization using multi-modal RNN | |
CN112183058A (zh) | 基于bert句子向量输入的诗词生成方法及装置 | |
CN115759119B (zh) | 一种金融文本情感分析方法、系统、介质和设备 | |
CN115526176A (zh) | 文本识别方法及装置、电子设备、存储介质 | |
CN109325110B (zh) | 印尼语文档摘要生成方法、装置、存储介质及终端设备 | |
CN116562275A (zh) | 一种结合实体属性图的自动文本摘要方法 | |
CN114818711B (zh) | 基于神经网络的多信息融合命名实体识别方法 | |
Thu et al. | Myanmar news headline generation with sequence-to-sequence model | |
CN115759090A (zh) | 一种结合软词典和汉字字形特征的中文命名实体识别方法 | |
CN114528861A (zh) | 一种基于语料库的外语翻译训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |