CN113127652A - 一种摘要获取方法、设备及计算机可读存储介质 - Google Patents
一种摘要获取方法、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113127652A CN113127652A CN202010041744.3A CN202010041744A CN113127652A CN 113127652 A CN113127652 A CN 113127652A CN 202010041744 A CN202010041744 A CN 202010041744A CN 113127652 A CN113127652 A CN 113127652A
- Authority
- CN
- China
- Prior art keywords
- text
- title
- distribution
- abstract
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种摘要获取方法、设备及计算机可读存储介质;方法包括:利用正文编码器,对多媒体正文进行编码,得到正文编码特征;并利用标题编码器,对多媒体标题进行编码,得到标题编码特征;利用解码器,对正文编码特征和标题编码特征进行当前解码时刻的解码,得到当前解码特征;当前解码时刻为解码时刻的任一时刻;利用词处理模型,对正文编码特征、标题编码特征和当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对多源复制词表分布和生成词表分布进行组合,根据组合结果确定当前关键词,从而当解码时刻结束时,得到由多个当前关键词构成的目标摘要。通过本发明实施例,能够提升获取到的摘要的准确度和语义丰富性。
Description
技术领域
本发明涉及人工智能领域中的摘要获取技术,尤其涉及一种摘要获取方法、设备及计算机可读存储介质。
背景技术
摘要,又称概要或内容提要,是从文本中摘录下来的要点,通常指以提供文本内容梗概为目的,不加评论和补充解释,简明、确切地记述文本重要内容的短文。通过摘要,用户可以快速获取到文本的主要内容,进而能够从海量的文本中确定所关心的目标文本;因此,确定文本的摘要至关重要。
一般来说,获取文本的摘要时,通常采用摘要生成方式或摘要抽取方式实现。然而,通过摘要生成方式获取到的文本的摘要,存在语句不通顺或敏感词等不安全生成问题;而通过摘要抽取方式获取到的文本的摘要,由于信息的来源仅局限于文本自身,存在信息单一的问题;因此,获取到的摘要的准确度差或语义丰富性低。
发明内容
本发明实施例提供一种摘要获取方法、设备及计算机可读存储介质,能够提升获取到的摘要的准确度和语义丰富性。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种摘要获取方法,包括:
获取多媒体文本,并获取预设摘要获取模型;所述多媒体文本包括多媒体正文和多媒体标题,所述预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型;
利用所述正文编码器,对所述多媒体正文进行编码,得到正文编码特征;并利用所述标题编码器,对所述多媒体标题进行编码,得到标题编码特征;
利用所述解码器,对所述正文编码特征和所述标题编码特征进行当前解码时刻的解码,得到当前解码特征;所述当前解码时刻为解码时刻的任一时刻;
利用所述词处理模型,对所述正文编码特征、所述标题编码特征和所述当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对所述多源复制词表分布和所述生成词表分布进行组合,根据组合结果确定当前关键词,从而当所述解码时刻结束时,得到由多个当前关键词构成的目标摘要;
其中,所述多源复制词表分布为所述多媒体文本中的关键词的分布信息,所述生成词表分布为基于所述多媒体文本生成的关键词的分布信息。
本发明实施例提供一种摘要获取装置,包括:
获取模块,用于获取多媒体文本,并获取预设摘要获取模型;所述多媒体文本包括多媒体正文和多媒体标题,所述预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型;
编码模块,用于利用所述正文编码器,对所述多媒体正文进行编码,得到正文编码特征;并利用所述标题编码器,对所述多媒体标题进行编码,得到标题编码特征;
解码模块,用于利用所述解码器,对所述正文编码特征和所述标题编码特征进行当前解码时刻的解码,得到当前解码特征;所述当前解码时刻为解码时刻的任一时刻;
摘要获取模块,用于利用所述词处理模型,对所述正文编码特征、所述标题编码特征和所述当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对所述多源复制词表分布和所述生成词表分布进行组合,根据组合结果确定当前关键词,从而当所述解码时刻结束时,得到由多个当前关键词构成的目标摘要;其中,所述多源复制词表分布为所述多媒体文本中的关键词的分布信息,所述生成词表分布为基于所述多媒体文本生成的关键词的分布信息。
本发明实施例提供一种摘要获取设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的摘要获取方法。
本发明实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的摘要获取方法。
本发明实施例具有以下有益效果:由于在获取多媒体文本对应的目标摘要时,所采用的模型是从多媒体文本中的关键词和基于多媒体文本生成的关键词两方面来确定解码出的关键词的概率值的;使得获得的目标摘要不仅具有了采用摘要抽取方式获得的摘要的准确性,还具有了采用摘要生成方式获得的摘要的丰富语义;另外,将多媒体文本的正文和标题均作为解码出的关键词的复制来源,实现了将多媒体文本的标题作为指导信息从多媒体文本中抽取关键词作为目标摘要的部分信息的技术方案,而多媒体文本的标题能够准确表达多媒体文本的重要含义,因此,进一步提升了所获得的目标摘要的准确度;从而,也就提升了获取到的摘要的准确度和语义丰富性。
附图说明
图1是一种示例性的摘要获取的应用示意图;
图2是本发明实施例提供的摘要获取系统100的一个可选的架构示意图;
图3是本发明实施例提供的服务器200的结构示意图;
图4是本发明实施例提供的摘要获取方法的一个可选的流程示意图;
图5是本发明实施例提供的预设摘要获取模型的结构示意图;
图6是本发明实施例提供的摘要获取方法的另一个可选的流程示意图;
图7是本发明实施例提供的摘要获取架构示意图;
图8是本发明实施例提供的摘要获取方法的又一个可选的流程示意图;
图9是本发明实施例提供的摘要获取系统100的另一个可选的架构示意图;
图10是本发明实施例提供的区块链网络600中区块链的结构示意图;
图11是本发明实施例提供的区块链网络600的功能架构示意图;
图12是本发明实施例提供的一种示例性的摘要获取方法应用示意图;
图13是本发明实施例提供的一种示例性的显示目标摘要的示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本发明实施例所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本发明实施例中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
2)机器学习(Machine Learning,ML),是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能;重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习通常包括人工神经网络、置信网络、强化学习、迁移学习和归纳学习等技术。
3)人工神经网络,是一种模仿生物神经网络结构和功能的数学模型,本文中人工神经网络的示例性结构包括深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)。其中,DNN内部的神经网络层可以分为三类,输入层,隐藏层和输出层,并且层与层之间是全连接的,也就是说,第k层的任意一个神经元一定与第k+1层的任意一个神经元相连;在摘要获取领域中,能够对用户进行合理的兴趣推测和衍生,提升内容多样性。
4)损失函数,又称代价函数,是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。
5)序列到序列(Sequence to Sequence,seq2seq),在序列到序列模型中,通过两个神经网络,一个神经网络(Encoder)负责接收多媒体文本,另一个神经网络(Decoder)负责将多媒体文本的输出成另一序列的目标文本(比如,多媒体文本的摘要),这两个过程依次分别称为编码过程和解码过程。其中,编码过程中,Encoder将可变长度的多媒体文本的信号序列编码为固定长度的向量表达,从而便于进行数学处理;解码过程中,Decoder将该固定长度的向量解码为可变长度的目标信号序列。
6)Attention机制,指把注意力集中放在重要的点上,而忽略其他不重要的因素。由于seq2seq模型中,原始编解码模型的Encoder过程会生成一个中间向量H,用于保存多媒体文本的语义信息,而这个中间向量H的长度是固定的,当多媒体文本的序列的长度比较长时,中间向量H无法保存多媒体文本全部的语义信息,多媒体文本的上下文语义信息受到了限制,也就限制了模型的处理能力;因此,使用Attention机制解决编解码模型对固定长度的限制。
7)区块链(Blockchain),由区块(Block)形成的加密的、链式的交易的存储结构。
8)区块链网络(Blockchain Network),通过共识的方式将新区块纳入区块链的一系列的节点的集合。
随着人工智能技术的研究和进步,人工智能技术在多个领域展开了研究和应用;例如,常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗和智能客服等;随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值;比如,还可以将人工智能应用在摘要获取领域。
这里,需要说明的是,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
另外,人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
需要说明的是,文本的摘要是自然语言处理领域的基础技术,通常应用在推荐等应用场景中。另外,在获取文本的摘要时,根据文本中文档的数量,分为多文档摘要获取和单文档摘要获取,而本发明实施例中的摘要获取方法是一种单文档摘要获取方法。
一般来说,在获取多媒体文本的摘要时,通常采用摘要生成方式(Abstrac tive)或摘要抽取方式(Extractive)实现。其中,摘要生成方式,指根据多媒体文本生成新的词语或短语而组合成的摘要的方式,采用该方式获得的摘要称为生成式摘要;比如ConvS2S(Convolutional Sequence to Sequence),利用卷积神经网络提取句子的N-Gram特征,并在Encoder和Decoder中间引入了Att ention机制,使用束搜索来解码生成词表中的词,最终构成完整的文本的摘要。当采用摘要生成方式获取多媒体文本的摘要时,虽然获取到的摘要的信息具备多样性,内容丰富,创作性好,但需要解决OOV(Out of Word,集外词)的表示和应用的问题,并且,生成的文本的摘要中,存在语句不通顺或敏感词等不安全生成问题。
而摘要抽取方式,即指从多媒体文本中抽取信息形成摘要的过程,采用该方式获得的摘要称为抽取式摘要;并且,对应摘要抽取方式,基于抽取单元的不同,分为词抽取方式和句子抽取方式。对于词抽取方式,比如,CopyNet,首先计算多媒体文本中词语的概率值,然后根据概率值来从多媒体文本中复制词语构成摘要。而对于句子抽取方式,比如Summarunner,对多媒体文本中的句子进行特征向量表示后,并根据每个句子的特征向量计算每个句子的得分值,进而根据该得分值来选择是否抽取该句子,最终把所抽取到的句子拼起来构成摘要。当采用摘要抽取方式获取多媒体文本的摘要时,虽然获取到的摘要的准确性高,不存在不安全生成问题,但由于摘要是从多媒体文本中抽取到的信息,摘要对应的信息单一,内容简单,创作性低,没有特色。
综上,基于生成式摘要的语义表达力强,但存在不安全生成问题;而抽取式摘要的准确性高,但存在语义表达力低问题;在获取多媒体文本的摘要时,结合摘要生成方式和摘要抽取方式来获得摘要;比如,指针生成器(Pointer G enerator),参见图1,多媒体正文1-1输入编码器Encoder1-2进行编码之后,将编码结果输入至解码器1-3中;以解码器1-3的第2个解码时刻为例进行说明,此时的解码输出状态1-31与编码的输出进行匹配,得到多媒体正文1-1的注意力权重1-4,即采用指针网络(Pointer Networks)计算得到的Decoder从Enco der中读取信息的权重;基于编码的输出和注意力权重1-4,得到多媒体正文1-1的上下文向量1-5;基于上下文向量1-5,以及解码输出状态1-31,也就得到了生成词表概率分布1-6;另外,根据多媒体正文的上下文向量1-5和解码输出状态1-31,确定分布权重pgen(属于0到1),并基于pgen结合多媒体正文的注意力权重1-4和生成词表概率分布1-6,得到扩展词表概率分布,进而根据扩展词表概率分布确定当前预测词1-7,最终得到多媒体正文的摘要1-8。如此,也就完成了结合摘要生成方式和摘要抽取方式来获得摘要的方法,从而,所获得的摘要也就具备了准确性和强表达力。然而,由于上述结合摘要生成方式和摘要抽取方式来获得摘要的过程中,存在对多媒体文本聚焦不准确的问题,比如,有些重要信息没有聚焦上,复制出来的是不重要的词语和信息,从而导致获取到的摘要的准确率低;另外,还存在重要词语(比如人名、地名,以及其他重要表述性词语)在多媒体文本的正文和生成词表中均缺失的情况,也会导致获取到的摘要的准确率低的问题。综上,所获得的摘要的准确性低,从而摘要的获取效果差。
基于此,本发明实施例提供一种摘要获取方法、设备和计算机可读存储介质,能够提升摘要的获取效果,提升获得的摘要的准确性。下面说明本发明实施例提供的摘要获取设备的示例性应用,本发明实施例提供的摘要获取设备可以实施为智能手机、平板电脑、笔记本电脑等各种类型的用户终端,也可以实施为服务器。下面,将说明摘要获取设备实施为服务器时的示例性应用。
参见图2,图2是本发明实施例提供的摘要获取系统100的一个可选的架构示意图,为实现支撑一个摘要获取应用,服务器400(多媒体服务器)通过网络300连接数据库500(预设任务队列和预设摘要缓存的统称),数据库500为服务器200(摘要获取设备)所对应的数据库,网络300可以是广域网或者局域网,又或者是二者的组合。另外,上述摘要获取系统100还包括终端410。
服务器200,用于从数据库500中获取多媒体文本,并获取预设摘要获取模型;多媒体文本包括多媒体正文和多媒体标题,预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型;利用正文编码器,对多媒体正文进行编码,得到正文编码特征;并利用标题编码器,对多媒体标题进行编码,得到标题编码特征;利用解码器,对正文编码特征和标题编码特征进行当前解码时刻的解码,得到当前解码特征;当前解码时刻为解码时刻的任一时刻;利用词处理模型,对正文编码特征、标题编码特征和当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对多源复制词表分布和生成词表分布进行组合,根据组合结果确定当前关键词,从而当解码时刻结束时,得到由多个当前关键词构成的目标摘要;其中,多源复制词表分布为多媒体文本中的关键词的分布信息,生成词表分布为基于多媒体文本生成的关键词的分布信息。
终端410,用于通过网络300和服务器400从数据库500中获取多媒体文本和目标摘要,并在图形界面411中显示多媒体文本和目标摘要。
需要说明的是,本发明实施例也可结合区块链技术实现,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。对于本发明实施例提供的结合区块链技术的摘要获取方法,具体参见后续描述。
参见图3,图3是本发明实施例提供的服务器200的结构示意图,图3所示的服务器200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。服务器200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Onl y Memory),易失性存储器可以是随机存取存储器(RAM,Random Access M emory)。本发明实施例描述的存储器250旨在包括任意适合类型的存储器。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB,Universal Serial Bus)等;
显示模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本发明实施例提供的摘要获取装置可以采用软件方式实现,图3示出了存储在存储器250中的摘要获取装置255,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块2551、编码模块2552、解码模块2553、摘要获取模块2554、模型训练模块2555、存储模块2556和区块链模块2557,将在下文中说明各个模块的功能。
在另一些实施例中,本发明实施例提供的摘要获取装置可以采用硬件方式实现,作为示例,本发明实施例提供的摘要获取装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的摘要获取方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Progra mmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmabl e Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
下面,将结合本发明实施例提供的服务器的示例性应用和实施,说明本发明实施例提供的摘要获取方法。
参见图4,图4是本发明实施例提供的摘要获取方法的一个可选的流程示意图,将结合图4示出的步骤进行说明。
S101、获取多媒体文本,并获取预设摘要获取模型;多媒体文本包括多媒体正文和多媒体标题,预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型。
在本发明实施例中,摘要获取设备进行摘要获取时,所针对的对象即多媒体文本,比如,新闻信息;而当摘要获取设备接收到多媒体文本,或者从预设存储设备中读取到多媒体文本时,也就获取到了多媒体文本。
需要说明的是,多媒体文本包括多媒体正文和多媒体标题;其中,多媒体正文指多媒体文本的正文,多媒体标题指多媒体文本的标题。
另外,摘要获取设备中预先存储有训练好的用于获取多媒体文本的摘要的模型,即预设摘要获取模型,比如,MSPG模型,或者,引入coverage机制的MSPG模型;因此,摘要获取设备能够获取到该预设摘要获取模型。并且,该预设摘要获取模型由多个子模型构成,这里,预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型。
需要说明的是,正文编码器用于对多媒体正文进行编码,得到多媒体正文的语义向量表示,比如,单向LSTM(Long Short-Term Memory,长短期记忆网络),双向LSTM,特征抽取器Transformer;标题编码器用于对多媒体标题进行编码,得到多媒体标题的语义特征表示,比如,单向LSTM,双向LSTM,特征抽取器Transformer;解码器用于对正文编码器的编码结果和标题编码器的编码结果进行解码,得到多媒体文本的另一种信息表示,比如,单向LSTM,双向LSTM;词处理模型用于对多媒体正文的语义特征表示、多媒体标题的语义特征表示和解码得到的多媒体文本的另一种信息表示进行处理,确定多媒体文本的摘要。
S102、利用正文编码器,对多媒体正文进行编码,得到正文编码特征;并利用标题编码器,对多媒体标题进行编码,得到标题编码特征。
在本发明实施例中,摘要获取设备在获得了预设摘要获取模型和多媒体文本之后,就能够利用预设摘要获取模型获取多媒体文本的摘要了。这里,摘要获取设备首先利用正文编码器对多媒体正文的语义特征进行提取,即对多媒体正文进行编码,得到多媒体正文的语义特征表示,也就得到了正文编码特征;并利用标题编码器对媒体标题的语义特征进行提取,即对多媒体标题进行编码,得到多媒体标题的语义特征表示,也就得到了标题编码特征。
需要说明的是,摘要获取设备在利用正文编码器对多媒体正文进行编码时,先对多媒体正文进行向量表示,再利用正文编码器对向量表示后的多媒体正文进行语义特征的提取;同理,摘要获取设备在利用标题编码器对媒体标题进行编码时,也是先对多媒体标题进行向量表示,再利用标题编码器对向量表示后的多媒体标题进行语义特征的提取。另外,摘要获取设备对多媒体正文和多媒体标题进行向量表示时,还可以基于增强的语义背景知识和/或优化的初始化词向量方法来实现。
S103、利用解码器,对正文编码特征和标题编码特征进行当前解码时刻的解码,得到当前解码特征;当前解码时刻为解码时刻的任一时刻。
在本发明实施例中,当摘要获取设备获得了正文编码特征和标题编码特征之后,由于正文编码特征表征了多媒体正文的语义特征,标题编码特征表征了多媒体标题的语义特征;因此,摘要获取设备能够在各个解码时刻,利用解码器对正文编码特征和标题编码特征,将多媒体文本表示成另一种信息表示了;这里,针对解码时刻的任一时刻,所解码出的多媒体文本的另一种信息表示即当前解码特征。
需要说明的是,解码器进行解码时,可以是依据预设词表还可以是动态词表,本发明实施例对此不作具体限定。
S104、利用词处理模型,对正文编码特征、标题编码特征和当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对多源复制词表分布和生成词表分布进行组合,根据组合结果确定当前关键词,从而当解码时刻结束时,得到由多个当前关键词构成的目标摘要;其中,多源复制词表分布为多媒体文本中的关键词的分布信息,生成词表分布为基于多媒体文本生成的关键词的分布信息。
在本发明实施例中,正文编码特征、标题编码特征和当前解码特征用于确定当前解码时刻对应的关键词;因此,当摘要获取设备获得了正文编码特征、标题编码特征和当前解码特征之后,就能够利用词处理模型对正文编码特征、标题编码特征和当前解码特征进行处理来确定当前解码时刻对应的关键词了。
这里,摘要获取设备利用词处理模型对正文编码特征、标题编码特征和当前解码特征进行组合,也就能够得到多媒体文本中的关键词的分布信息,即多源复制词表分布;以及也能够得到基于多媒体文本生成的关键词的分布信息,即生成词表分布,这里,生成词表分布指预设词表或动态词表中每个关键词与当前解码时刻对应的输出的概率值;而预设词表是对预设语料进行切词,并对切词结果基于词频进行逆序排列后,从排序后的切词结果中选择前预设数量的词所组成的。
由于多源复制词表分布表征了当前解码时刻输出的关键词来源于多媒体文本的概率分布,生成词表分布表征了当前解码时刻输出的关键词为生成的词的概率分布;因此,摘要获取设备利用词处理模型对多源复制词表分布和生成词表分布进行组合,并从组合结果中选择预设词数量个概率最大的关键词作为当前解码时刻所输出的关键词,也就得到了当前关键词;此时,也就完成了一次当前解码时刻的解码。
在本发明实施例中,摘要获取设备针对解码时刻中的任一时刻都执行如当前解码时刻对应的操作,也就得到了多个当前关键词,进而也就能够根据多个当前关键词得到多媒体文本的摘要,即目标摘要。
需要说明的是,摘要获取设备在根据多个当前关键词得到目标摘要时,综合考虑每个当前关键词中的多个子当前关键词,与多个当前关键词中其他当前关键词中的多个子当前关键词的上下文关系,从各个当前关键词中选择一个子当前关键词构成目标摘要,以确定获得的目标摘要为最优解。比如,摘要获取设备采用“Beam Search”算法根据多个当前关键词确定目标摘要。
可以理解的是,本发明实施例提供的摘要获取方法结合了摘要生成方式和摘要抽取方式各自的优点,使得获得的多媒体文本的目标摘要准确且语义丰富。同时,由于所采用的预设摘要获取模型是从多媒体文本的正文和标题中复制关键词作为目标摘要的候选词的,以及将多媒体文本的正文和标题的编码特征作为生成关键词的基础信息的;也就是说,将多媒体文本的标题作为指导信息进行单独编码和复制词,使得能够准确聚焦多媒体文本的重要信息,避免引入累计错误的问题,提升了目标摘要的准确度和语义丰富性。另外,预设摘要获取模型中的编码器可以为两个或两个以上,模型结构具备可扩展性。
进一步地,在本发明实施例中,词处理模型包括贡献度模型、上下文向量模型、词复制模型和词生成模型;其中,贡献度模型用于确定预设摘要获取模型中的每个时刻的编码结果在当前解码时刻的信息贡献度;上下文向量模型用于确定解码器在当前解码时刻解码时所依据的多媒体文本的信息;词复制模型用于确定当前解码时刻对应的从多媒体正文复制的关键词的概率分布;词生成模型用于确定当前解码时刻对应的生成的关键词的概率分布。从而,本发明实施例S104中的摘要获取设备利用词处理模型,对正文编码特征、标题编码特征和当前解码特征进行匹配组合,得到多源复制词表分布和生成词表分布,包括S1041-S1044,下面结合各步骤进行说明。
S1041、利用贡献度模型,分别对正文编码特征和当前解码特征的组合,以及标题编码特征和当前解码特征的组合进行第一归一化处理,得到与正文编码特征对应的正文信息贡献度,以及与标题编码特征对应的标题信息贡献度。
在本发明实施例中,由于当前解码特征是基于正文编码特征和标题编码特征获得的;因此,摘要获取设备为了确定正文编码特征对当前解码特征的信息贡献度,计算正文编码特征和当前解码特征的匹配度,也就获得了正文编码特征对当前解码特征的信息贡献度,也就获得了与正文编码特征对应的正文信息贡献度;同理,摘要获取设备为了确定标题编码特征对当前解码特征的信息贡献度,计算标题编码特征和当前解码特征的匹配度,也就获得了标题编码特征对当前解码特征的信息贡献度,也就获得了与标题编码特征对应的标题信息贡献度。
这里,摘要获取设备利用贡献度模型,对正文编码特征和当前解码特征的组合进行第一归一化处理,也就得到了正文信息贡献度;同理,摘要获取设备利用贡献度模型,对标题编码特征和当前解码特征的组合进行第一归一化处理,也就得到了标题信息贡献度。这里,第一归一化处理用于确定匹配度。
示例性地,贡献度模型如式(1)和(2)所示:
at=softmax(et) (2)
其中,vT、Wh、Ws和battn为贡献度模型中的训练参数,tanh()和softmax()均为现有的函数运算,hi为编码特征(正文编码特征或标题编码特征)中第i个编码时刻的编码特征,st为t时刻(当前解码时刻)的解码特征(当前解码特征);为第i个编码时刻的编码特征对t时刻的解码特征的贡献度信息;et为所有编码时刻的贡献度信息构成的集合;at为所有编码时刻的编码特征分别对应的贡献度所构成的集合,即信息贡献度(正文信息贡献度或标题信息贡献度)。
S1042、利用上下文向量模型,将正文编码特征与正文信息贡献度进行组合,得到正文上下文向量;以及将标题编码特征与标题信息贡献度进行组合,得到标题上下文向量。
在本发明实施例中,摘要获取设备获得了正文信息贡献度和标题信息贡献度之后,利用上下文向量模型,将正文信息贡献度中的子贡献度与正文编码特征中的每个编码时刻的编码特征进行一一对应融合(对应组合后再加权求和,或对应组合后求均值等),所获得的融合结果即当前解码时刻解码时所依据的多媒体正文的信息,也就获得了正文上下文向量;同理,摘要获取设备利用上下文向量模型,将标题信息贡献度中的子贡献度与标题编码特征中的每个编码时刻的编码特征进行一一对应融合,所获得的融合结果即当前解码时刻解码时所依据的多媒体标题的信息,也就获得了标题上下文向量。
需要说明的是,正文上下文向量为当前解码时刻解码器从多媒体正文的语义特征中读取到的信息的固定长度的表示;标题上下文向量为当前解码时刻解码器从多媒体标题的语义特征中读取到的信息的固定长度的表示。
示例性地,贡献度模型如式(3)所示:
其中,为上下文向量(正文上下文向量或标题上下文向量),指式(2)中at的一个第i个编码时刻的信息贡献度,hi为编码特征(正文编码特征或标题编码特征)中第i个编码时刻的编码特征,n为编码时刻的数量(多媒体正文的编码时刻的数量或多媒体标题的编码时刻的数量,1至n为i的取值范围)。
S1043、利用词复制模型,基于当前解码特征,对正文信息贡献度和标题信息贡献度进行融合,得到多源复制词表分布。
在本发明实施例中,摘要获取设备获得了当前解码特征、正文信息贡献度和标题信息贡献度之后,就能利用词复制模型,基于当前解码特征,对正文信息贡献度和标题信息贡献度进行融合,获取从多媒体文本中复制的关键词的概率分布,也就得到了多源复制词表分布。
S1044、利用词生成模型,对正文上下文向量、标题上下文向量和当前解码特征进行第二归一化处理,得到生成词表分布。
在本发明实施例中,摘要获取设备获得了正文上下文向量和标题上下文向量之后,结合当前解码特征,进行第二归一化处理,也就获得了预设词表中各个关键词在当前解码时刻的概率分布,也就获得了生成词表分布。
示例性地,词生成模型如式(4)所示:
其中,Pvocab为生成词表分布,softmax()为现有的函数运算,V‘、V‘、b和b‘为词生成模型中的训练参数,st为t时刻(当前解码时刻)的解码特征(当前解码特征),为正文上下文向量,为标题上下文向量,为对st、和进行拼接处理。这里,易知,和是根据式(1)-(3)获得的。
需要说明的是,S1043与S1044在执行顺序上不分先后。
进一步地,在本发明实施例中,词复制模型包括词确定模型、正文词分布模型、标题词分布模型和复制分布组合模型;其中,词确定模型用于从多媒体文本中确定待复制的关键词;正文词分布模型用于基于当前解码特征和正文信息贡献度来确定多媒体正文中待复制的关键词的概率分布;标题词分布模型用于基于当前解码特征和标题信息贡献度来确定多媒体标题中待复制的关键词的概率分布;复制分布组合模型用于组合多媒体正文中待复制的关键词的概率分布和多媒体标题中待复制的关键词的概率分布;从而,S1043可通过S10431-S10434实现;也就是说,摘要获取设备利用词复制模型,基于正文上下文向量和标题上下文向量,对正文信息贡献度和标题信息贡献度进行融合,得到多源复制词表分布,包括S10431-S10434,下面将结合各步骤进行说明。
S10431、利用词确定模型,分别从多媒体正文和多媒体标题中复制关键词,得到与多媒体正文对应的正文复制词表,以及与多媒体标题对应的标题复制词表。
在本发明实施例中,摘要获取设备利用词确定模型从多媒体正文中确定待复制的关键词,所确定的待复制的关键词也就构成了正文复制词表;同理,摘要获取设备利用词确定模型从多媒体标题中确定待复制的关键词,所确定的待复制的关键词也就构成了标题复制词表;此时,也就完成了分别从多媒体正文和多媒体标题中复制关键词,得到与多媒体正文对应的正文复制词表,以及与多媒体标题对应的标题复制词表的处理。
S10432、利用正文词分布模型,从正文复制词表中确定与当前解码特征匹配的目标正文词表,并从正文信息贡献度中确定与目标正文词表的每个关键词对应的目标正文信息贡献度,对目标正文信息贡献度进行加权求和,得到与正文复制词表对应的正文复制词表分布。
在本发明实施例中,摘要获取设备利用正文词分布模型,将正文复制词表中与当前解码特征匹配的关键词构成目标正文词表,并从正文信息贡献度中确定与目标正文词表中各个关键词对应的目标正文信息贡献度,对目标正文信息贡献度进行加权求和,也就得到了多媒体正文中待复制的关键词的概率分布,也就获得了与正文复制词表对应的正文复制词表分布。
S10433、利用标题词分布模型,从标题复制词表中确定与当前解码特征匹配的目标标题词表,并从标题信息贡献度中确定与目标标题词表的每个关键词对应的目标标题信息贡献度,对目标标题信息贡献度进行加权求和,得到与标题复制词表对应的标题复制词表分布。
在本发明实施例中,摘要获取设备利用标题词分布模型,将标题复制词表中与当前解码特征匹配的关键词构成目标标题词表,并从标题信息贡献度中确定与目标标题词表中各个关键词对应的目标标题信息贡献度,对目标标题信息贡献度进行加权求和,也就得到了多媒体标题中待复制的关键词的概率分布,也就获得了与标题复制词表对应的标题复制词表分布。
S10434、利用复制分布组合模型,组合正文复制词表分布和标题复制词表分布,得到多源复制词表分布。
在本发明实施例中,摘要获取设备获得了正文复制词表分布和标题复制词表分布之后,将正文复制词表分布和标题复制词表分布组合,也就获得多源复制词表分布。
进一步地,在本发明实施例中,复制分布组合模型包括解码输入获取模型、复制权重确定模型和多源复制模型;其中,解码输入获取模型用于获取当前解码时刻的输入特征;复制权重确定模型用于确定多源复制词表分布中正文复制词表分布所占的权重和多源复制词表分布中标题复制词表分布所占的权重;多源复制模型用于基于多个复制词表分布(正文复制词表分布和标题复制词表分布)确定该多个复制词表分布融合后的结果。从而,S10434可通过S104341-S104343实现;也就是说,摘要获取设备利用复制分布组合模型,组合正文复制词表分布和标题复制词表分布,得到多源复制词表分布,包括S104341-S104343,下面结合各步骤进行说明:
S104341、利用解码输入获取模型,获取当前解码时刻的当前解码输入特征。
在本发明实施例中,解码器进行当前时刻的解码时是需要输入特征的,因此,摘要获取设备能够利用输入获取模型获取到当前解码时刻的输入特征,也就获得了当前解码输入特征。
需要说明的是,当前解码输入特征为上一解码时刻的解码结果的向量表示,比如,上一解码时刻的解码结果的Embedding值;而当当前解码时刻为第一个解码时刻时,当前解码输入特征为正文编码器和标题编码器两者的编码结果。
S104342、利用复制权重确定模型,对正文上下文向量、标题上下文向量、当前解码状态和当前解码输入特征进行第一非线性组合,得到正文复制词表分布权重,并获取正文复制词表分布权重的对立值,得到标题复制词表分布权重。
在本发明实施例中,摘要获取设备在获得了正文上下文向量、标题上下文向量、当前解码状态和当前解码输入特征之后,就能利用复制权重确定模型,对正文上下文向量、标题上下文向量、当前解码状态和当前解码输入特征进行第一非线性组合了,所得到的结果即多源复制词表分布中正文复制词表分布所占的权重,也就获得了正文复制词表分布权重;此时,获取正文复制词表分布权重的对立值,也就获得了多源复制词表分布中标题复制词表分部所占的权重,也就得到了标题复制词表分布权重。
需要说明的是,获取对立值的处理是相对于数值基准而言的;比如,当数值基准为1,正文复制词表分布权重为λ,则正文复制词表分布权重的对立值为1-λ。
示例性地,复制权重确定模型如式(5)所示:
其中,λ为正文复制词表分布权重,σ()为现有的函数运算, 和b1均为复制权重确定模型中的训练参数,为正文上下文向量,为标题上下文向量,st为t时刻(当前解码时刻)的解码特征(当前解码特征),xt为t时刻(当前解码时刻)的输入特征(当前解码输入特征)。这里,易知,标题复制词表分布权重为1-λ。
S104343、利用多源复制模型,将正文复制词表分布权重与正文复制词表分布的融合结果,以及标题复制词表分布权重与标题复制词表分布的融合结果进行组合,得到多源复制词表分布。
在本发明实施例中,摘要获取设备获得了正文复制词表分布权重和标题复制词表分布权重之后,就能利用多源复制模型、正文复制词表分布权重和标题复制词表分布权重,对正文复制词表分布和标题复制词表分布进行组合了;这里,摘要获取设备利用多源复制模型,将正文复制词表分布权重与正文复制词表分布的融合结果,以及标题复制词表分布权重与标题复制词表分布的融合结果进行组合,来得到多源复制词表分布。
进一步地,在本发明实施例中,词处理模型还包括分布权重确定模型和分布组合模型;其中,分布权重确定模型用于在将多源复制词表分布和生成词表分布组合时确定多源复制词表分布和生成词表分布分别所占的权重;分布组合模型用于基于多源复制词表分布和生成词表分布分别所占的权重,组合多源复制词表分布和生成词表分布。从而S104中,摘要获取设备利用词处理模型,对多源复制词表分布和生成词表分布进行组合,包括S1045-S1046,下面将结合各步骤进行说明。
S1045、利用分布权重确定模型,对当前解码特征、正文上下文向量、标题上下文向量和当前解码输入特征进行第二非线性组合,得到生成词表分布权重;并获取生成词表分布权重的对立值,得到复制词表分布权重。
在本发明实施例中,由于分布权重确定模型在将多源复制词表分布和生成词表分布组合时,是基于当前解码特征、正文上下文向量、标题上下文向量和当前解码输入特征,来确定多源复制词表分布和生成词表分布分别所占的权重;因此,当摘要获取设备获得了当前解码特征、正文上下文向量、标题上下文向量和当前解码输入特征之后,就能够利用分布权重确定模型,对当前解码特征、正文上下文向量、标题上下文向量和当前解码输入特征进行第二非线性组合,来得到生成词表分布权重和复制词表分布权重;其中,第二非线性组合的结果为生成词表分布权重,而生成词表分布权重的对立值则是复制词表分布权重。
示例性地,分布权重确定模型如式(6)所示:
其中,Pgen为生成词表分布权重,σ()为现有的函数运算, 和b2均为分布权重确定模型中的训练参数,为正文上下文向量,为标题上下文向量,st为t时刻(当前解码时刻)的解码特征(当前解码特征),xt为t时刻(当前解码时刻)的输入特征(当前解码输入特征)。这里,易知,复制词表分布权重为1-Pgen。
S1046、利用分布组合模型,将复制词表分布权重与多源复制词表分布的融合结果,以及生成词表分布权重与生成词表分布的融合结果进行组合,完成多源复制词表分布和生成词表分布的组合。
在本发明实施例中,摘要获取设备获得了生成词表分布权重和复制词表分布权重,以及生成词表分布和复制词表分布之后,就能够利用分布组合模型,将复制词表分布权重与多源复制词表分布的融合结果,以及生成词表分布权重与生成词表分布的融合结果进行组合,来完成多源复制词表分布和生成词表分布的组合了。
需要说明的是,参见图5,图5是本发明实施例提供的预设摘要获取模型的结构示意图,如图5所示,预设摘要获取模型5-1包括正文编码器5-11、标题编码器5-12、解码器5-13和词处理模型5-14;其中,词处理模型5-14包括贡献度模型5-141、上下文向量模型5-142、词复制模型5-143、词生成模型5-144、分布权重确定模型5-145和分布组合模型5-146;并且,词复制模型5-143包括词确定模型5-1431、正文词分布模型5-1432、标题词分布模型5-1433和复制分布组合模型5-1434,复制分布组合模型5-1434包括解码输入获取模型5-14341、复制权重确定模型5-14342和多源复制模型5-14343。从而,摘要获取设备执行本发明实施例提供的摘要获取方法时,首先,经过正文编码器5-11、标题编码器5-12和解码器5-13;然后,依次经过贡献度模型5-141、上下文向量模型5-142、词确定模型5-1431、正文词分布模型5-1432、标题词分布模型5-1433、解码输入获取模型5-14341、复制权重确定模型5-14342和多源复制模型5-14343;最后,依次经过词生成模型5-144、分布权重确定模型5-145和分布组合模型5-146。
进一步地,参见图6,在本发明实施例中,S101中摘要获取设备获取预设摘要获取模型之前,该摘要获取方法还包括S105-S110,下面将结合图6示出的步骤进行说明。
S105、获取训练样本和原始摘要获取模型;训练样本为正文样本、标题样本和摘要样本组成的样本对,原始摘要获取模型包括原始正文编码器、原始标题编码器、原始解码器和原始词处理模型。
在本发明实施例中,摘要获取设备中的预设摘要获取模型是预先训练好的,而摘要获取设备在训练得到预设摘要获取模型之前,需要先获取用于训练得到预设摘要获取模型的样本,也就获得了训练样本;这里,训练样本为正文样本、标题样本和摘要样本组成的样本对,其中,正文样本和标题样本为多媒体文本样本,摘要样本为多媒体文本样本的摘要的标注数据。
另外,摘要获取设备还需要搭建原始摘要获取模型,通过对原始摘要获取模型的持续训练来获得预设摘要获取模型;这里,原始摘要获取模型为待训练的模型,并且,原始摘要获取模型包括多个待训练的子模型结构:原始正文编码器、原始标题编码器、原始解码器和原始词处理模型;其中,原始正文编码器为正文编码器的待训练的模型结构,用于对正文样本的语义特征进行提取;原始标题编码器为标题编码器的待训练的模型结构,用于对标题样本的语义特征进行提取;原始解码器为解码器的待训练的模型结构,用于对提取到的正文样本的语义特征和标题样本的语义特征进行解码,得到多媒体文本样本的另一种信息表示;原始词处理模型为词处理模型的待训练的模型结构,用于对多媒体文本样本的另一种信息表示进行处理,确定多媒体文本样本预测的摘要。
需要说明的是,摘要获取设备还可以对训练样本进行数据增强,来提升最终获得的预设摘要获取模型的准确度。
S106、利用原始正文编码器,对正文样本进行编码,得到正文样本编码特征;并利用原始标题编码器,对标题样本进行编码,得到标题样本编码特征。
在本发明实施例中,摘要获取设备获得了包括正文样本、标题样本和摘要样本的训练样本,以及包括原始正文编码器、原始标题编码器、原始解码器和原始词处理模型的原始摘要获取模型之后,就能够利用训练样本对原始摘要获取模型进行训练了。首先,摘要获取设备利用原始正文编码器,对正文样本的语义特征进行提取,即对正文样本进行编码,得到正文样本的语义特征表示,也就得到了正文样本编码特征;并利用原标题编码器,对标题样本的语义特征进行提取,即对标题样本进行编码,得到标题样本的语义特征表示,也就得到了标题样本编码特征。
S107、利用原始解码器,对正文样本编码特征和标题样本编码特征进行当前解码训练时刻的解码,得到当前解码样本特征;当前解码训练时刻为解码训练时刻的任一时刻。
在本发明实施例中,当摘要获取设备获得了正文样本编码特征和标题样本编码特征之后,由于正文样本编码特征表征了正文样本的语义特征,标题样本编码特征表征了标题样本的语义特征;因此,摘要获取设备能够利用原始解码器对正文样本编码特征和标题样本编码特征在各个解码训练时刻将多媒体文本样本表示成另一种信息表示;这里,针对解码训练时刻的任一时刻,所解码出的多媒体文本样本的另一种信息表示即当前解码样本特征。
S108、利用原始词处理模型,对正文编码样本特征、标题编码样本特征和当前解码样本特征进行组合,得到多源复制词表样本分布和生成词表样本分布;并对多源复制词表样本分布和生成词表样本分布进行组合,得到目标词表样本分布。
在本发明实施例中,正文编码样本特征、标题编码样本特征和当前解码样本特征用于确定当前解码训练时刻对应的关键词的分布概率;因此,当摘要获取设备获得了正文编码样本特征、标题编码样本特征和当前解码样本特征之后,就能够利用原始词处理模型对正文编码样本特征、标题编码样本特征和当前解码样本特征进行处理来确定当前解码训练时刻对应的关键词的分布概率了。
这里,摘要获取设备利用词处理模型对正文编码样本特征、标题编码样本特征和当前解码样本特征进行组合,也就能够得到多媒体文本样本中的关键词的分布信息,即多源复制词表样本分布;以及能够得到基于多媒体文本样本生成的关键词的分布信息,即生成词表样本分布,也指预设词表中每个关键词与当前解码训练时刻对应的输出的概率值。
由于多源复制词表分布表征了当前解码时刻输出的关键词来源于多媒体文本的概率分布,生成词表分布表征了当前解码时刻输出的关键词为生成的词的概率分布;因此,摘要获取设备利用词处理模型对多源复制词表分布和生成词表分布进行组合,所得到的目标词表样本分布中也就包含了当前解码训练时刻所输出的关键词。
S109、获取目标词表样本分布和摘要样本之间的差异,得到当前损失函数,从而当解码训练时刻结束时,得到由多个当前损失函数组成的目标损失函数。
在本发明实施例中,摘要获取设备获得了当前解码训练时刻的目标词表样本分布之后,由于目标词表样本分布表征了原始摘要获取样本当前的摘要获取能力,摘要样本为多媒体文本样本的真实样本;因此,通过获取目标词表样本分布和摘要样本之间的差异,也就得到了当前解码训练时刻的损失函数,即当前损失函数;此时,也就完成了当前解码训练时刻的解码。而当解码训练时刻全部结束时,也就得到了多个当前损失函数,也就得到了目标损失函数;此时,也就完成了一次解码。
需要说明的是,摘要获取设备还可以根据极大似然估计法对摘要样本在目标词表样本分布中的概率值进行处理,来获得当前损失函数。
S110、利用目标损失函数持续对预设摘要获取模型进行持续训练,直到满足训练截止条件时,得到包括正文编码器、标题编码器、解码器和词处理模型的预设摘要获取模型。
在本发明实施例中,由于目标损失函数在一定程度上表征了当前的解码效果;因此,摘要获取设备获得了目标损失函数之后,就能够利用目标损失函数持续对预设摘要获取模型中的参数进行调整,来持续训练预设摘要获取模型了;直到训练过程中确定满足训练截止条件时,结束训练,此时的模型也就是包括正文编码器、标题编码器、解码器和词处理模型的预设摘要获取模型。
需要说明的是,利用目标损失函数持续对预设摘要获取模型进行持续训练的过程是一个迭代的过程。另外,正文编码器为训练完成的原始正文编码器,标题编码器为训练完成的原始标题编码器,解码器为训练完成的原始编码器,词处理模型为训练完成的原始词处理模型。
在本发明实施例中,摘要获取设备还具备对预设摘要获取模型评估的功能。
示例性地,摘要获取设备对预设摘要获取模型的结果进行评估时,选择ROUGE(包括ROUGE-1、ROUGE-2、ROUGE-L三个指标)和人工评测两个指标进行评估;其中,预设摘要获取模型14-1为MSPG模型,评估对比模型14-2为seq2seq和Attention机制(基础),评估对比模型14-3为指针生成模型,评估对比模型14-4为指针生成模型和覆盖(coverage)模型;评估结果为:预设摘要获取模型14-1的评估指数对应的数值依次为39.19、15.33、30.12和55.6%,评估对比模型14-2的评估指数对应的数值依次为24.17、8.32、23.26和18.2%,评估对比模型14-3的评估指数对应的数值依次为32.7、11.83、25.63和33.3%,评估对比模型14-4的评估指数对应的数值依次为35.22、13.1、27.87和39.7%。
进一步地,在本发明实施例中,摘要获取设备得到包括正文编码器、标题编码器、解码器和词处理模型的预设摘要获取模型之后,该摘要获取方法还包括S111-S112,下面将结合该步骤进行说明。
S111、获取新的训练样本;新的训练样本用于对预设摘要获取模型进行优化。
需要说明的是,当摘要获取设备获得了预设摘要获取模型时,还可以通过获取新的训练样本对预设摘要获取模型进行优化,以提升预设摘要获取模型的泛化能力。
S112、基于新的训练样本,优化预设摘要获取模型,得到优化后的预设摘要获取模型。
在本发明实施例中,当摘要获取设备获得了新的训练样本之后,能够基于新的训练样本优化预设摘要获取模型,以利用优化后的预设摘要获取模型进行摘要获取。这里,优化过程与训练得到预设摘要获取模型的过程类似,本发明实施例在此不再赘述。
相应地,在本发明实施例中,摘要获取设备利用优化后的预设摘要获取模型对多媒体文本进行摘要获取,得到目标摘要。
可以理解的是,摘要获取设备通过不断对预设摘要获取模型进行优化,能够提升优化后的预设摘要获取模型的泛化能力,进而基于优化后的预设摘要获取模型实现摘要获取时,能够进一步提升摘要获取的效果。
进一步地,在本发明实施例中,S101中摘要获取设备获取多媒体文本,包括:摘要获取设备从预设任务队列中,获取多媒体文本;预设任务队列为多媒体服务器所请求的摘要获取任务构成的队列。
相应地,当解码时刻结束时,得到由多个当前关键词构成的目标摘要之后,该摘要获取方法还包括S113:摘要获取设备将目标摘要和多媒体文本存储至预设摘要缓存中,以使多媒体服务器获取到终端发送的信息获取请求时,从预设摘要缓存中获取目标摘要和多媒体文本,并将目标摘要和多媒体文本发送至终端,以在终端的显示界面的第一显示区域显示多媒体标题,在终端显示界面的第二显示区域显示目标摘要。
这里,还可以是终端向多媒体服务器发送信息获取请求时,多媒体服务器响应信息获取请求,将多媒体文本发送至预设任务队列,以使摘要获取设备从预设任务队列中获取多媒体文本,针对多媒体文本利用本发明实施例提供的摘要获取方法获取目标摘要,将该目标摘要与对应的多媒体文本存储至预设摘要缓存;以使多媒体服务器从预设摘要缓存中获取目标摘要与对应的多媒体文本返回至终端进行显示;又可以是摘要获取设备将所述目标摘要和所述多媒体文本存储至预设摘要缓存中,以使所述多媒体服务器从所述预设摘要缓存中获取所述目标摘要和所述多媒体文本,并在获取到终端发送的信息获取请求时,将所述目标摘要和所述多媒体文本发送至所述终端,以在所述终端的显示界面的第一显示区域显示所述多媒体标题,在所述终端显示界面的第二显示区域显示所述目标摘要;本发明实施例对此不作具体限定。
另外,目标摘要和多媒体文本的数量分别为至少一个,此时,目标摘要中的至少一个摘要与多媒体文本中的至少一个文本一一对应;在显示界面显示时,显示一个文本的标题的区域之后为用于显示一个对应的文本中的摘要的区域。
需要说明的是,多媒体服务器进行目标摘要和多媒体文本的显示时,是通过终端进行显示时。这里,终端接收到摘要显示指令时,通过信息获取请求向多媒体服务器获取多媒体文本和目标摘要;接收多媒体服务器针对信息获取请求发送的多媒体文本和目标摘要,其中,多媒体文本包括多媒体正文和多媒体标题;在显示界面的第一显示区域显示目标摘要,在显示界面的第二显示区域显示多媒体标题,在显示界面的第三显示区域显示多媒体正文的相关信息(图片或缩略形式的多媒体正文);当接收到作用于第一显示区域、第二显示区域和第三显示区域的任一区域时,跳转至多媒体文本详细浏览界面,该多媒体文本详细浏览界面中显示多媒体正文。如此,能够使得用户在通过显示界面浏览多媒体信息时,能够快速准确通过多媒体标题和目标摘要确定多媒体正文的重要信息,进而提高多媒体正文的点击率等操作行为。
也就是说,本发明实施例中的摘要获取方法,是通过如图7所示的摘要获取架构实现的,如图7所示,该摘要获取架构包括数据源层7-1、任务接收层7-2、摘要获取层7-3和任务分发层7-4;其中,数据源层7-1,用于获取多媒体服务器所请求的摘要获取任务并存储至任务池中;任务接收层7-2,用于从数据源层7-1中的任务池中获取摘要获取任务,将获取到的摘要获取任务入预设任务队列(比如,Kafka队列),以等待进行摘要获取处理;摘要获取层7-3,用于从预设任务队列中获取摘要获取任务,该摘要获取任务中包括多媒体文本,并利用预设摘要获取模型对多媒体文本进行摘要获取,得到目标摘要,并将目标摘要和多媒体文本的对应关系存储至预设摘要缓存中(比如,Redis缓存);任务分发层7-4,用于将预设摘要缓存中的多媒体文本和目标摘要分发至多媒体服务器,完成任务回传,以使多媒体服务器完成目标摘要和多媒体文本的显示。
进一步地,参见图8,图8是本发明实施例提供的摘要获取方法的又一个可选的流程示意图,如图8所示,本发明实施例中S104之后,还包括S114;也就是说,当解码时刻结束时,摘要获取设备得到由多个当前关键词构成的目标摘要之后,该摘要获取方法还包括S114:将目标摘要和多媒体文本发送至区块链网络,以使区块链网络的节点将目标摘要和多媒体文本填充至新区块,且当对新区块共识一致时,将新区块追加至区块链的尾部以完成上链。这里,摘要获取设备将获得的目标摘要和多媒体文本进行上链,如此,以保证不可篡改。
基于图8示出的摘要获取方法,参见图9,图9是本发明实施例提供的摘要获取系统100的另一个可选的架构示意图,包括区块链网络600(示例性示出了共识节点610-1至共识节点610-3)、认证中心700、业务主体800和业务主体900,下面分别进行说明。
区块链网络600的类型是灵活多样的,例如可以为公有链、私有链或联盟链中的任意一种。以公有链为例,任何业务主体的电子设备例如用户终端和服务器,都可以在不需要授权的情况下接入区块链网络600;以联盟链为例,业务主体在获得授权后其下辖的电子设备(例如终端/服务器)可以接入区块链网络600,此时,成为区块链网络600中的客户端节点。
在一些实施例中,客户端节点可以只作为区块链网络600的观察者,即提供支持业务主体发起交易(例如,用于上链存储数据或查询链上数据)功能,对于区块链网络600的节点的功能,例如排序功能、共识服务和账本功能等,客户端节点可以缺省或者有选择性(例如,取决于业务主体的具体业务需求)地实施。从而,可以将业务主体的数据和业务处理逻辑最大程度迁移到区块链网络600中,通过区块链网络600实现数据和业务处理过程的可信和可追溯。
区块链网络600中的节点接收来自不同业务主体(例如图9中示出的业务主体800)的客户端节点(例如,图9中示出的归属于业务主体800的客户端节点810,即摘要获取设备)提交的交易,执行交易以更新账本或者查询账本,执行交易的各种中间结果或最终结果可以返回业务主体的客户端节点中显示。
下面以多个业务主体接入区块链网络以实现多媒体文本及目标摘要的管理为例,说明区块链网络的示例性应用。
继续参见图9,管理环节涉及的业务主体800可以是基于人工智能的摘要获取系统,业务主体900可以是多媒体文本的显示系统,从认证中心700进行登记注册获得各自的数字证书,数字证书中包括业务主体的公钥、以及认证中心700对业务主体的公钥和身份信息签署的数字签名,用来与业务主体针对交易的数字签名一起附加到交易中,并被发送到区块链网络,以供区块链网络从交易中取出数字证书和签名,验证消息的可靠性(即是否未经篡改)和发送消息的业务主体的身份信息,区块链网络会根据身份进行验证,例如是否具有发起交易的权限。业务主体下辖的电子设备(例如终端或者服务器)运行的客户端都可以向区块链网络600请求接入而成为客户端节点。
业务主体800的客户端节点810用于获取多媒体文本;利用预设摘要获取模型获取多媒体文本的摘要,得到目标摘要;将多媒体文本及对应的目标摘要发送至区块链网络600。
其中,将多媒体文本及对应的目标摘要发送至区块链网络600的操作,可以预先在客户端节点810设置业务逻辑,当产生目标摘要时,客户端节点810将多媒体文本及对应的目标摘要自动发送至区块链网络600,也可以由业务主体800的业务人员在客户端节点810中登录,手动打包多媒体文本及目标摘要,并将其发送至区块链网络600。在发送时,客户端节点810根据多媒体文本及目标摘要生成对应更新操作的交易,在交易中指定了实现更新操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点810的数字证书、签署的数字签名(例如,使用客户端节点810的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络600中的共识节点。
区块链网络600中的共识节点中接收到交易时,对交易携带的数字证书和数字签名进行验证,验证成功后,根据交易中携带的业务主体800的身份,确认业务主体800是否是具有交易权限,数字签名和权限验证中的任何一个验证判断都将导致交易失败。验证成功后签署共识节点自己的数字签名(例如,使用共识节点610-1的私钥对交易的摘要进行加密得到),并继续在区块链网络600中广播。
区块链网络600中的共识节点接收到验证成功的交易后,将交易填充到新的区块中,并进行广播。区块链网络600中的共识节点广播的新区块时,会对新区块进行共识过程,如果共识成功,则将新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易:对于提交更新多媒体文本及目标摘要的交易,在状态数据库中添加包括多媒体文本及目标摘要的键值对。
业务主体900的业务人员在客户端节点910(终端400)中登录,输入摘要获取查询请求,客户端节点910根据摘要获取查询请求生成对应更新操作/查询操作的交易,在交易中指定了实现更新操作/查询操作需要调用的智能合约、以及向智能合约传递的参数,交易还携带了客户端节点910的数字证书、签署的数字签名(例如,使用客户端节点910的数字证书中的私钥,对交易的摘要进行加密得到),并将交易广播到区块链网络600中的共识节点。其中,摘要获取查询请求用于查询多媒体文本及对应的目标摘要。
区块链网络600中的共识节点中接收到交易,对交易进行验证、区块填充及共识一致后,将填充的新区块追加到自身所存储的区块链的尾部,并根据交易的结果更新状态数据库,执行新区块中的交易;比如,对于提交的查询某个多媒体文本的交易,从状态数据库中查询多媒体文本对应的键值对,并返回交易结果。
值得说明的是,在图9中示例性地示出了将多媒体文本及对应的目标摘要直接上链的过程,但在另一些实施例中,对于多媒体文本的数据量较大的情况,客户端节点810可将多媒体文本的哈希以及目标摘要的哈希成对上链,将原始的多媒体文本以及目标摘要存储于分布式文件系统或数据库。客户端节点910从分布式文件系统或数据库获取到多媒体文本以及目标摘要后,可结合区块链网络600中对应的哈希进行校验,从而减少上链操作的工作量。
作为区块链的示例,参见图10,图10是本发明实施例提供的区块链网络600中区块链的结构示意图,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,新产生的交易的记录被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长,区块之间基于哈希值的链式结构保证了区块中交易的防篡改和防伪造。
下面说明本发明实施例提供的区块链网络的示例性的功能架构,参见图11,图11是本发明实施例提供的区块链网络600的功能架构示意图,包括应用层601、共识层602、网络层603、数据层604和资源层605,下面分别进行说明。
资源层605封装了实现区块链网路600中的各个共识节点610的计算资源、存储资源和通信资源。
数据层604封装了实现账本的各种数据结构,包括以文件系统中的文件实现的区块链,键值型的状态数据库和存在性证明(例如区块中交易的哈希树)。
网络层603封装了点对点(P2P,Point to Point)网络协议、数据传播机制和数据验证机制、接入认证机制和业务主体身份管理的功能。
其中,P2P网络协议实现区块链网络600中节点之间的通信,数据传播机制保证了交易在区块链网络600中的传播,数据验证机制用于基于加密学方法(例如数字证书、数字签名、公/私钥对)实现节点之间传输数据的可靠性;接入认证机制用于根据实际的业务场景对加入区块链网络600的业务主体的身份进行认证,并在认证通过时赋予业务主体接入区块链网络600的权限;业务主体身份管理用于存储允许接入区块链网络600的业务主体的身份、以及权限(例如能够发起的交易的类型)。
共识层602封装了区块链网络600中的共识节点对区块达成一致性的机制(即共识机制)、交易管理和账本管理的功能。共识机制包括POS、POW和DPOS等共识算法,支持共识算法的可插拔。
交易管理用于验证节点接收到的交易中携带的数字签名,验证业务主体的身份信息,并根据身份信息判断确认其是否具有权限进行交易(从业务主体身份管理读取相关信息);对于获得接入区块链网络600的授权的业务主体而言,均拥有认证中心颁发的数字证书,业务主体利用自己的数字证书中的私钥对提交的交易进行签名,从而声明自己的合法身份。
账本管理用于维护区块链和状态数据库。对于取得共识的区块,追加到区块链的尾部;执行取得共识的区块中的交易,当交易包括更新操作时更新状态数据库中的键值对,当交易包括查询操作时查询状态数据库中的键值对并向业务主体的客户端节点返回查询结果。支持对状态数据库的多种维度的查询操作,包括:根据区块序列号(例如交易的哈希值)查询区块;根据区块哈希值查询区块;根据交易序列号查询区块;根据交易序列号查询交易;根据业务主体的账号(序列号)查询业务主体的账号数据;根据通道名称查询通道中的区块链。
应用层601封装了区块链网络能够实现的各种业务,包括交易的溯源、存证和验证等。
下面,将说明本发明实施例在一个实际的应用场景中的示例性应用。
示例性地,参见图12,图12是本发明实施例提供的一种示例性的摘要获取方法应用示意图;如图12所示,新闻信息包括新闻原文12-1和新闻标题12-2;首先,将新闻原文12-1(多媒体正文)输入至Encoder1 12-3(正文编码器)进行编码,得到编码状态12-4(正文编码特征),将新闻标题12-2(多媒体标题)输入至Encoder2 12-5(标题编码器)进行编码,得到编码状态12-6(标题编码特征)。其次,Decoder 12-7根据编码状态12-4和编码状态12-6进行当前解码时刻的解码,得到输出状态12-8(当前解码特征)。然后,基于编码状态12-4和输出状态12-8,得到新闻原文12-1对应的Attention值12-9(正文信息贡献度),进而得到上下文向量12-10(正文上下文向量);基于编码状态12-6和输出状态12-8,得到新闻标题12-5对应的Attention值12-11(标题信息贡献度),进而得到上下文向量12-12(标题上下文向量)。再后,基于上下文向量12-10、上下文向量12-12和输出状态12-8,确定复制权重λ12-13,进而基于复制权重λ12-13、Attention值12-9和Attention值12-11,获得多源复制词表分布12-14;以及基于上下文向量12-10、上下文向量12-12和输出状态12-8,确定分布权重12-15,同时基于上下文向量12-10、上下文向量12-12和输出状态12-8,确定生成词表分布12-16,进而基于分布权重12-15、多源复制词表分布12-14和生成词表分布12-16,确定当前关键词12-17,进而得到摘要12-18(目标摘要)。
示例性地,参见图13,图13是本发明实施例提供的一种示例性的显示目标摘要的示意图;如图13所示,在本发明实施例的终端的显示界面13-1的推荐栏目中,显示区域13-12(第一显示区域)显示的为新闻标题(多媒体标题),显示区域13-13(第二显示区域)显示的为新闻摘要(目标摘要),显示区域13-11(第三显示区域)显示的为新闻原文(多媒体正文)的图片;如此,采用本发明实施例提供的摘要获取方法能够实现,通过高质量的目标摘要提升新闻信息的点击率。其中,多媒体服务器为终端提供服务功能。
下面继续说明本发明实施例提供的摘要获取装置255的实施为软件模块的示例性结构,在一些实施例中,如图3所示,存储在存储器250的摘要获取装置255中的软件模块可以包括:
获取模块2551,用于获取多媒体文本,并获取预设摘要获取模型;所述多媒体文本包括多媒体正文和多媒体标题,所述预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型;
编码模块2552,用于利用所述正文编码器,对所述多媒体正文进行编码,得到正文编码特征;并利用所述标题编码器,对所述多媒体标题进行编码,得到标题编码特征;
解码模块2553,用于利用所述解码器,对所述正文编码特征和所述标题编码特征进行当前解码时刻的解码,得到当前解码特征;所述当前解码时刻为解码时刻的任一时刻;
摘要获取模块2554,用于利用所述词处理模型,对所述正文编码特征、所述标题编码特征和所述当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对所述多源复制词表分布和所述生成词表分布进行组合,根据组合结果确定当前关键词,从而当所述解码时刻结束时,得到由多个当前关键词构成的目标摘要;其中,所述多源复制词表分布为所述多媒体文本中的关键词的分布信息,所述生成词表分布为基于所述多媒体文本生成的关键词的分布信息。
进一步地,所述词处理模型包括贡献度模型、上下文向量模型、词复制模型和词生成模型;所述摘要获取模块2554,还用于利用所述贡献度模型,分别对所述正文编码特征和所述当前解码特征的组合,以及所述标题编码特征和所述当前解码特征的组合进行第一归一化处理,得到与所述正文编码特征对应的正文信息贡献度,以及与所述标题编码特征对应的标题信息贡献度;利用所述上下文向量模型,将所述正文编码特征与所述正文信息贡献度进行融合,得到正文上下文向量;以及将所述标题编码特征与所述标题信息贡献度进行融合,得到标题上下文向量;利用所述词复制模型,基于所述当前解码特征,对所述正文信息贡献度和所述标题信息贡献度进行融合,得到所述多源复制词表分布;利用所述词生成模型,对所述正文上下文向量、所述标题上下文向量和所述当前解码特征进行第二归一化处理,得到所述生成词表分布。
进一步地,所述词复制模型包括词确定模型、正文词分布模型、标题词分布模型和复制分布组合模型;所述摘要获取模块2554,还用于利用所述词确定模型,分别从所述多媒体正文和所述多媒体标题中复制关键词,得到与所述多媒体正文对应的正文复制词表,以及与所述多媒体标题对应的标题复制词表;利用所述正文词分布模型,从所述正文复制词表中确定与所述当前解码特征匹配的目标正文词表,并从所述正文信息贡献度中确定与所述目标正文词表的每个关键词对应的目标正文信息贡献度,对所述目标正文信息贡献度进行加权求和,得到与所述正文复制词表对应的所述正文复制词表分布;利用所述标题词分布模型,从所述标题复制词表中确定与所述当前解码特征匹配的目标标题词表,并从所述标题信息贡献度中确定与所述目标标题词表的每个关键词对应的目标标题信息贡献度,对所述目标标题信息贡献度进行加权求和,得到与所述标题复制词表对应的所述标题复制词表分布;利用所述复制分布组合模型,组合所述正文复制词表分布和所述标题复制词表分布,得到所述多源复制词表分布。
进一步地,所述复制分布组合模型包括解码输入获取模型、复制权重确定模型和多源复制模型;所述摘要获取模块2554,还用于利用所述解码输入获取模型,获取所述当前解码时刻的当前解码输入特征;利用所述复制权重确定模型,对所述正文上下文向量、所述标题上下文向量、所述当前解码状态和所述当前解码输入特征进行第一非线性组合,得到正文复制词表分布权重,并获取所述正文复制词表分布权重的对立值,得到标题复制词表分布权重;利用所述多源复制模型,将所述正文复制词表分布权重与所述正文复制词表分布的融合结果,以及所述标题复制词表分布权重与所述标题复制词表分布的融合结果进行组合,得到所述多源复制词表分布。
进一步地,所述词处理模型还包括分布权重确定模型和分布组合模型;所述摘要获取模块2554,还用于利用所述分布权重确定模型,对所述当前解码特征、所述正文上下文向量、所述标题上下文向量和所述当前解码输入特征进行第二非线性组合,得到生成词表分布权重;并获取所述生成词表分布权重的对立值,得到复制词表分布权重;利用所述分布组合模型,将所述复制词表分布权重与所述多源复制词表分布的融合结果,以及所述生成词表分布权重与所述生成词表分布的融合结果进行组合,完成所述多源复制词表分布和所述生成词表分布的组合。
进一步地,所述摘要获取装置255还包括模型训练模块2555,用于获取训练样本和原始摘要获取模型;所述训练样本为正文样本、标题样本和摘要样本组成的样本对,所述原始摘要获取模型包括原始正文编码器、原始标题编码器、原始解码器和原始词处理模型;利用所述原始正文编码器,对所述正文样本进行编码,得到正文样本编码特征;并利用所述原始标题编码器,对所述标题样本进行编码,得到标题样本编码特征;利用所述原始解码器,对所述正文样本编码特征和所述标题样本编码特征进行当前解码训练时刻的解码,得到当前解码样本特征;所述当前解码训练时刻为解码训练时刻的任一时刻;利用所述原始词处理模型,对所述正文编码样本特征、所述标题编码样本特征和所述当前解码样本特征进行组合,得到多源复制词表样本分布和生成词表样本分布;并对所述多源复制词表样本分布和所述生成词表样本分布进行组合,得到目标词表样本分布;获取所述目标词表样本分布和所述摘要样本之间的差异,得到当前损失函数,从而当所述解码训练时刻结束时,得到由多个当前损失函数组成的目标损失函数;利用所述目标损失函数持续对所述预设摘要获取模型进行持续训练,直到满足训练截止条件时,得到包括所述正文编码器、所述标题编码器、所述解码器和所述词处理模型的所述预设摘要获取模型。
进一步地,所述获取模块2551,还用于从预设任务队列中,获取所述多媒体文本;所述预设任务队列为多媒体服务器所请求的摘要获取任务构成的队列;
相应地,所述摘要获取装置255还包括存储模块2556,用于将所述目标摘要和所述多媒体文本存储至预设摘要缓存中,以使
所述多媒体服务器获取到终端发送的信息获取请求时,从所述预设摘要缓存中获取所述目标摘要和所述多媒体文本,并将所述目标摘要和所述多媒体文本发送至所述终端,以在所述终端的显示界面的第一显示区域显示所述多媒体标题,在所述终端显示界面的第二显示区域显示所述目标摘要。
进一步地,所述摘要获取装置255还包括区块链模块2557,用于将所述目标摘要和所述多媒体文本发送至区块链网络,以使所述区块链网络的节点将所述目标摘要和所述多媒体文本填充至新区块,且当对所述新区块共识一致时,将所述新区块追加至区块链的尾部以完成上链。
本发明实施例提供一种存储有可执行指令的计算机存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本发明实施例提供的摘要获取方法,例如,如图4示出的摘要获取方法。
在一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本发明实施例,由于在获取多媒体文本对应的目标摘要时,所采用的模型是从多媒体文本中的关键词和基于多媒体文本生成的关键词两方面来确定解码出的关键词的概率值的;使得获得的目标摘要不仅具有了采用摘要抽取方式获得的摘要的准确性,还具有了采用摘要生成方式获得的摘要的丰富语义;另外,将多媒体文本的正文和标题均作为解码出的关键词的复制来源,实现了将多媒体文本的标题作为指导信息从多媒体文本中抽取关键词作为目标摘要的部分信息的技术方案,而多媒体文本的标题能够准确表达多媒体文本的重要含义,因此,进一步提升了所获得的目标摘要的准确度;从而,也就提升了获取到的摘要的准确度和语义丰富性。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。
Claims (10)
1.一种摘要获取方法,其特征在于,包括:
获取多媒体文本,并获取预设摘要获取模型;所述多媒体文本包括多媒体正文和多媒体标题,所述预设摘要获取模型包括正文编码器、标题编码器、解码器和词处理模型;
利用所述正文编码器,对所述多媒体正文进行编码,得到正文编码特征;并利用所述标题编码器,对所述多媒体标题进行编码,得到标题编码特征;
利用所述解码器,对所述正文编码特征和所述标题编码特征进行当前解码时刻的解码,得到当前解码特征;所述当前解码时刻为解码时刻的任一时刻;
利用所述词处理模型,对所述正文编码特征、所述标题编码特征和所述当前解码特征进行组合,得到多源复制词表分布和生成词表分布;并对所述多源复制词表分布和所述生成词表分布进行组合,根据组合结果确定当前关键词,从而当所述解码时刻结束时,得到由多个当前关键词构成的目标摘要;
其中,所述多源复制词表分布为所述多媒体文本中的关键词的分布信息,所述生成词表分布为基于所述多媒体文本生成的关键词的分布信息。
2.根据权利要求1所述的方法,其特征在于,所述词处理模型包括贡献度模型、上下文向量模型、词复制模型和词生成模型;所述利用所述词处理模型,对所述正文编码特征、所述标题编码特征和所述当前解码特征进行组合,得到多源复制词表分布和生成词表分布,包括:
利用所述贡献度模型,分别对所述正文编码特征和所述当前解码特征的组合,以及所述标题编码特征和所述当前解码特征的组合进行第一归一化处理,得到与所述正文编码特征对应的正文信息贡献度,以及与所述标题编码特征对应的标题信息贡献度;
利用所述上下文向量模型,将所述正文编码特征与所述正文信息贡献度进行融合,得到正文上下文向量;以及将所述标题编码特征与所述标题信息贡献度进行融合,得到标题上下文向量;
利用所述词复制模型,基于所述当前解码特征,对所述正文信息贡献度和所述标题信息贡献度进行融合,得到所述多源复制词表分布;
利用所述词生成模型,对所述正文上下文向量、所述标题上下文向量和所述当前解码特征进行第二归一化处理,得到所述生成词表分布。
3.根据权利要求2所述的方法,其特征在于,所述词复制模型包括词确定模型、正文词分布模型、标题词分布模型和复制分布组合模型;所述利用所述词复制模型,基于所述当前解码特征,对所述正文信息贡献度和所述标题信息贡献度进行融合,得到所述多源复制词表分布,包括:
利用所述词确定模型,分别从所述多媒体正文和所述多媒体标题中复制关键词,得到与所述多媒体正文对应的正文复制词表,以及与所述多媒体标题对应的标题复制词表;
利用所述正文词分布模型,从所述正文复制词表中确定与所述当前解码特征匹配的目标正文词表,并从所述正文信息贡献度中确定与所述目标正文词表的每个关键词对应的目标正文信息贡献度,对所述目标正文信息贡献度进行加权求和,得到与所述正文复制词表对应的所述正文复制词表分布;
利用所述标题词分布模型,从所述标题复制词表中确定与所述当前解码特征匹配的目标标题词表,并从所述标题信息贡献度中确定与所述目标标题词表的每个关键词对应的目标标题信息贡献度,对所述目标标题信息贡献度进行加权求和,得到与所述标题复制词表对应的所述标题复制词表分布;
利用所述复制分布组合模型,组合所述正文复制词表分布和所述标题复制词表分布,得到所述多源复制词表分布。
4.根据权利要求3所述的方法,其特征在于,所述复制分布组合模型包括解码输入获取模型、复制权重确定模型和多源复制模型;所述利用所述复制分布组合模型,组合所述正文复制词表分布和所述标题复制词表分布,得到所述多源复制词表分布,包括:
利用所述解码输入获取模型,获取所述当前解码时刻的当前解码输入特征;
利用所述复制权重确定模型,对所述正文上下文向量、所述标题上下文向量、所述当前解码状态和所述当前解码输入特征进行第一非线性组合,得到正文复制词表分布权重,并获取所述正文复制词表分布权重的对立值,得到标题复制词表分布权重;
利用所述多源复制模型,将所述正文复制词表分布权重与所述正文复制词表分布的融合结果,以及所述标题复制词表分布权重与所述标题复制词表分布的融合结果进行组合,得到所述多源复制词表分布。
5.根据权利要求4所述的方法,其特征在于,所述词处理模型还包括分布权重确定模型和分布组合模型;所述利用所述词处理模型,对所述多源复制词表分布和所述生成词表分布进行组合,包括:
利用所述分布权重确定模型,对所述当前解码特征、所述正文上下文向量、所述标题上下文向量和所述当前解码输入特征进行第二非线性组合,得到生成词表分布权重;并获取所述生成词表分布权重的对立值,得到复制词表分布权重;
利用所述分布组合模型,将所述复制词表分布权重与所述多源复制词表分布的融合结果,以及所述生成词表分布权重与所述生成词表分布的融合结果进行组合,完成所述多源复制词表分布和所述生成词表分布的组合。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述获取预设摘要获取模型之前,所述方法还包括:
获取训练样本和原始摘要获取模型;所述训练样本为正文样本、标题样本和摘要样本组成的样本对,所述原始摘要获取模型包括原始正文编码器、原始标题编码器、原始解码器和原始词处理模型;
利用所述原始正文编码器,对所述正文样本进行编码,得到正文样本编码特征;并利用所述原始标题编码器,对所述标题样本进行编码,得到标题样本编码特征;
利用所述原始解码器,对所述正文样本编码特征和所述标题样本编码特征进行当前解码训练时刻的解码,得到当前解码样本特征;所述当前解码训练时刻为解码训练时刻的任一时刻;
利用所述原始词处理模型,对所述正文编码样本特征、所述标题编码样本特征和所述当前解码样本特征进行组合,得到多源复制词表样本分布和生成词表样本分布;并对所述多源复制词表样本分布和所述生成词表样本分布进行组合,得到目标词表样本分布;
获取所述目标词表样本分布和所述摘要样本之间的差异,得到当前损失函数,从而当所述解码训练时刻结束时,得到由多个当前损失函数组成的目标损失函数;
利用所述目标损失函数持续对所述预设摘要获取模型进行持续训练,直到满足训练截止条件时,得到包括所述正文编码器、所述标题编码器、所述解码器和所述词处理模型的所述预设摘要获取模型。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述获取多媒体文本,包括:
从预设任务队列中,获取所述多媒体文本;所述预设任务队列为多媒体服务器所请求的摘要获取任务构成的队列;
相应地,所述当所述解码时刻结束时,得到由多个当前关键词构成的目标摘要之后,所述方法还包括:
将所述目标摘要和所述多媒体文本存储至预设摘要缓存中,以使
所述多媒体服务器获取到终端发送的信息获取请求时,从所述预设摘要缓存中获取所述目标摘要和所述多媒体文本,并将所述目标摘要和所述多媒体文本发送至所述终端,以在所述终端的显示界面的第一显示区域显示所述多媒体标题,在所述终端显示界面的第二显示区域显示所述目标摘要。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述当所述解码时刻结束时,得到由多个当前关键词构成的目标摘要之后,所述方法还包括:
将所述目标摘要和所述多媒体文本发送至区块链网络,以使
所述区块链网络的节点将所述目标摘要和所述多媒体文本填充至新区块,且当对所述新区块共识一致时,将所述新区块追加至区块链的尾部以完成上链。
9.一种摘要获取设备,其特征在于,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行时,实现权利要求1至8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010041744.3A CN113127652A (zh) | 2020-01-15 | 2020-01-15 | 一种摘要获取方法、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010041744.3A CN113127652A (zh) | 2020-01-15 | 2020-01-15 | 一种摘要获取方法、设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113127652A true CN113127652A (zh) | 2021-07-16 |
Family
ID=76771341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010041744.3A Pending CN113127652A (zh) | 2020-01-15 | 2020-01-15 | 一种摘要获取方法、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113127652A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554421A (zh) * | 2021-09-14 | 2021-10-26 | 南京烽火星空通信发展有限公司 | 一种基于区块链的警务资源数据治理协同方法 |
CN113836257A (zh) * | 2021-10-13 | 2021-12-24 | 科大讯飞股份有限公司 | 一种热词挖掘方法、装置、设备及存储介质 |
CN114691858A (zh) * | 2022-03-15 | 2022-07-01 | 电子科技大学 | 一种基于改进的unilm摘要生成方法 |
CN116028620A (zh) * | 2023-02-20 | 2023-04-28 | 知呱呱(天津)大数据技术有限公司 | 一种基于多任务特征协同的生成专利摘要的方法及系统 |
WO2023103308A1 (zh) * | 2021-12-07 | 2023-06-15 | 苏州浪潮智能科技有限公司 | 模型训练、文本预测方法、装置、电子设备及介质 |
-
2020
- 2020-01-15 CN CN202010041744.3A patent/CN113127652A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554421A (zh) * | 2021-09-14 | 2021-10-26 | 南京烽火星空通信发展有限公司 | 一种基于区块链的警务资源数据治理协同方法 |
CN113836257A (zh) * | 2021-10-13 | 2021-12-24 | 科大讯飞股份有限公司 | 一种热词挖掘方法、装置、设备及存储介质 |
CN113836257B (zh) * | 2021-10-13 | 2024-04-30 | 科大讯飞股份有限公司 | 一种热词挖掘方法、装置、设备及存储介质 |
WO2023103308A1 (zh) * | 2021-12-07 | 2023-06-15 | 苏州浪潮智能科技有限公司 | 模型训练、文本预测方法、装置、电子设备及介质 |
CN114691858A (zh) * | 2022-03-15 | 2022-07-01 | 电子科技大学 | 一种基于改进的unilm摘要生成方法 |
CN114691858B (zh) * | 2022-03-15 | 2023-10-03 | 电子科技大学 | 一种基于改进的unilm摘要生成方法 |
CN116028620A (zh) * | 2023-02-20 | 2023-04-28 | 知呱呱(天津)大数据技术有限公司 | 一种基于多任务特征协同的生成专利摘要的方法及系统 |
CN116028620B (zh) * | 2023-02-20 | 2023-06-09 | 知呱呱(天津)大数据技术有限公司 | 一种基于多任务特征协同的生成专利摘要的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113127652A (zh) | 一种摘要获取方法、设备及计算机可读存储介质 | |
CN111310436B (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN110598651B (zh) | 一种信息处理方法、装置及存储介质 | |
CN111552799B (zh) | 信息处理方法、装置、电子设备及存储介质 | |
JP2023539532A (ja) | テキスト分類モデルのトレーニング方法、テキスト分類方法、装置、機器、記憶媒体及びコンピュータプログラム | |
CN111026319B (zh) | 一种智能文本处理方法、装置、电子设备及存储介质 | |
US20220020064A1 (en) | Feature processing method and apparatus for artificial intelligence recommendation model, electronic device, and storage medium | |
CN113420128B (zh) | 文本匹配方法、装置、存储介质及计算机设备 | |
CN111444181B (zh) | 知识图谱更新方法、装置及电子设备 | |
CN116702737B (zh) | 文案生成方法、装置、设备、存储介质及产品 | |
CN110597963A (zh) | 表情问答库的构建方法、表情搜索方法、装置及存储介质 | |
CN110825975A (zh) | 一种信息推荐方法、装置、设备及计算机可读存储介质 | |
Zhang et al. | Amm: Attentive multi-field matching for news recommendation | |
CN111026858A (zh) | 基于项目推荐模型的项目信息处理方法及装置 | |
CN111552797B (zh) | 名称预测模型的训练方法、装置、电子设备及存储介质 | |
CN112749561B (zh) | 一种实体识别方法及设备 | |
CN112767910A (zh) | 音频信息合成方法、装置、计算机可读介质及电子设备 | |
CN116700839B (zh) | 一种任务处理方法、装置、设备、存储介质及程序产品 | |
CN115221294A (zh) | 对话处理方法、装置、电子设备及存储介质 | |
CN111552798B (zh) | 基于名称预测模型的名称信息处理方法、装置、电子设备 | |
CN110119513A (zh) | 一种基于大数据分析的远程日语教学交互系统及交互方法 | |
CN113033209B (zh) | 文本关系抽取方法、装置、存储介质及计算机设备 | |
CN111552890B (zh) | 基于名称预测模型的名称信息处理方法、装置、电子设备 | |
CN111860597B (zh) | 一种视频信息处理方法、装置、电子设备及存储介质 | |
CN113254597B (zh) | 模型训练方法、查询处理方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40047933 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |