CN110297885B - 实时事件摘要的生成方法、装置、设备及存储介质 - Google Patents

实时事件摘要的生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110297885B
CN110297885B CN201910446730.7A CN201910446730A CN110297885B CN 110297885 B CN110297885 B CN 110297885B CN 201910446730 A CN201910446730 A CN 201910446730A CN 110297885 B CN110297885 B CN 110297885B
Authority
CN
China
Prior art keywords
text
representation
event
knowledge
user query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910446730.7A
Other languages
English (en)
Other versions
CN110297885A (zh
Inventor
杨敏
曲强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Institute Of Advanced Technology Chinese Academy Of Sciences Co ltd
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201910446730.7A priority Critical patent/CN110297885B/zh
Publication of CN110297885A publication Critical patent/CN110297885A/zh
Application granted granted Critical
Publication of CN110297885B publication Critical patent/CN110297885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Abstract

本发明适用计算机技术领域,提供了一种实时事件摘要的生成方法、装置、设备及存储介质,该方法包括:接收文本流和用户查询文本,依据知识库生成文本流中事件文本的和用户查询文本的知识感知文本表示,依据生成的知识感知文本表示和交互式多头注意力网络,生成事件文本的和用户查询文本的交互式学习文本表示,依据生成的交互式学习文本表示和动态记忆网络,生成事件文本的特定文本表示,将特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度,降低了实时事件摘要的冗余度,提高了实时事件摘要的生成效果。

Description

实时事件摘要的生成方法、装置、设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种实时事件摘要的生成方法、装置、设备及存储介质。
背景技术
随着流媒体应用的快速发展,互联网中的信息量呈现爆炸式增长,人们利用流媒体应用获取信息的同时,也往往因为信息量的庞大和繁杂,无法获取自己最感兴趣的信息,收到许多困扰以及造成不必要的事件浪费。事件摘要(Event Summarization)是自然语言处理(Natural Language Processing,简称NLP)领域中十分具有挑战性的任务,任务目的是为给定的文本流生成信息量丰富的文本摘要,并在事件动态变化过程中实时更新文本摘要,提供给人们感兴趣的事件的文本摘要。然而,关于事件摘要的工作主要侧重于新闻文章,通过采用静态摘要方法对文本进行解析后生成文本摘要,并且只对文本摘要进行简单的更新。静态摘要方法每次只能生成一条摘要,无法随时间去推断事件的演化过程并在出现新信息时实时更新摘要,更不适合大规模的动态流媒体应用。
实时事件摘要(Real-time Event Summarization)旨在从大量实时的文本流中生成一系列文本摘要,这些文本摘要能够准确地描述用户所感兴趣的事件。实时事件摘要一般用于新闻及社交媒体场景,应用前景十分广阔,例如,包括Twitter在内的一些流媒体应用能够向用户提供当前热门或用户感兴趣的推文的摘要推送服务。同时,这也是一项十分具有挑战性的任务。首先,新闻文本通常由专业记者或作家撰写,句子和语法结构完整,提取的摘要质量良好。但是社交媒体文本通常较短,存在不少拼写错误及语法病句,还有许多网络热门词句,为社交媒体文本的摘要工作造成较大阻碍。其次,与静态新闻摘要相比,社交媒体文本的摘要生成必须沿着时间轴的动态的文本流进行。另外,由于在线文本流的信息量不断增加,采用静态方法生成事件摘要的成本骤增且不可能保持实时更新状态。
在已知的一项研究成果中,提出了通过建立和维持适当的推送更新阈值来实现最佳的推送结果的方式、采用局部最优学习来选择或跳过文本流中的文本分方式、以及将文本流的实时推送定义为一个顺序决策问题并基于神经网络的强化学习(NNRL)算法用于实时决策的方式等等.尽管这些研究已经小有成效,实时事件摘要的生成方法还有待改进。首先,实时事件摘要系统的信息丰富度有待提升;其次,现有的研究往往侧重于只生成具有高度相关性的实时事件摘要,却忽略了实时事件摘要的非冗余性,这将严重降低其性能,可能向用户推送重复冗余的多个文本;第三,大多数方法将相关性预测和实时事件摘要视为顺序步骤或仅将相关性预测分数视为实时事件摘要模型的特征,导致实时事件摘要的性能不佳。
发明内容
本发明的目的在于提供一种实时事件摘要的生成控制方法、装置、设备及存储介质,旨在解决现有技术中实时事件摘要信息不够丰富、冗余度较高、实时事件摘要性能不佳的问题。
一方面,本发明提供了一种实时事件摘要的生成方法,所述方法包括下述步骤:
接收文本流和用户查询文本,所述文本流包括按时间排序的事件文本;
依据所述事件文本、所述用户查询文本和预设的知识库,生成所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示;
依据所述事件文本的知识感知文本表示、所述用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成所述事件文本的交互式学习文本表示和所述用户查询文本的交互式学习文本表示;
依据所述事件文本的交互式学习文本表示、所述用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成所述事件文本的特定文本表示;
将所述事件文本的特定文本表示输入训练好的多任务联合训练模型,生成所述文本流的实时事件摘要,所述多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型。
另一方面,本发明提供了一种实时事件摘要的生成装置,所述装置包括:
文本接收模块,用于接收文本流和用户查询文本,所述文本流包括按时间排序的事件文本;
知识感知表示生成模块,用于依据所述事件文本、所述用户查询文本和预设的知识库,生成所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示;
交互式表示生成模块,用于依据所述事件文本的知识感知文本表示、所述用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成所述事件文本的交互式学习文本表示和所述用户查询文本的交互式学习文本表示;
特定表示生成模块,用于依据所述事件文本的交互式学习文本表示、所述用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成所述事件文本的特定文本表示;以及
实时摘要生成模块,用于将所述事件文本的特定文本表示输入训练好的多任务联合训练模型,生成所述文本流的实时事件摘要,所述多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型。
另一方面,本发明还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实时事件摘要的生成方法所述的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述实时事件摘要的生成方法所述的步骤。
本发明接收文本流和用户查询文本,文本流包括按时间排序的事件文本,依据知识库生成事件文本和用户查询文本的知识感知文本表示,依据这些知识感知文本表示和交互式多头注意力网络,生成事件文本和用户查询文本的交互式学习文本表示,依据这些交互式学习文本表示和动态记忆网络,生成事件文本的特定文本表示,将特定文本表示输入多任务联合训练模型,得到实时事件摘要,从而借助知识库有效地丰富了实时事件摘要的内容,通过交互式学习和注意力机制更好地学习了文本表示,通过动态记忆网络有效地降低了实时事件摘要的冗余度,通过多任务联合训练模型实现对实时事件摘要任务和相关性预测任务联合处理,提高实时事件摘要的性能,进而有效地实时事件摘要的生成效果。
附图说明
图1是本发明实施例一提供的实时事件摘要的生成方法法的实现流程图;
图2是本发明实施例二提供的实时事件摘要的生成方法的实现流程图;
图3是本发明实施例三提供的实时事件摘要的生成装置的结构示意图;
图4是本发明实施例三提供的实时事件摘要的生成装置的优选结构示意图;以及
图5是本发明实施例四提供的计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的实时事件摘要的生成方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,接收文本流和用户查询文本,文本流包括按时间排序的事件文本。
本发明适用于数据处理平台或计算机、服务器等数据处理设备。可通过在网络中实时采集事件文本(例如社交媒体文本),由这些不同时间戳下采集到的事件文本构成文本流。用户查询文本为用户输入的关键字文本。每个事件文本和用户查询文本中都包括多个单词。
在步骤S102中,依据事件文本、用户查询文本和预设的知识库,生成事件文本的知识感知文本表示和用户查询文本的知识感知文本表示。
在本发明实施例中,知识库(Knowledge base,KB)中包含大量的知识,例如微软知识库或者一些基于维基百科构建的知识库,借助知识库对事件文本和用户查询文本进行文本表示,可有效地提高实时时间摘要的丰富度。
在本发明实施例中,事件文本的知识感知文本表示包括事件文本的初始上下文表示和初始知识表示,用户查询文本的知识感知文本表示包括用户查询文本的初始上下文表示和初始知识表示。在获得文本流和用户查询文本后,依据文本流中事件文本的单词得到事件文本的初始上下文表示,依据知识库和注意力机制得到事件文本的初始知识表示。同样的,依据文本流中用户查询文本的单词得到用户查询文本的初始上下文表示,依据知识库和注意力机制得到用户查询文本的初始知识表示。
在步骤S103中,依据事件文本的知识感知文本表示、用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成事件文本的交互式学习文本表示和用户查询文本的交互式学习文本表示。
在本发明实施例中,预先构建并训练交互式多头注意力网络,将事件文本的和用户查询文本的知识感知文本表示输入训练好的交互式多头注意力网络,得到每个事件文本的注意力矩阵,基于事件文本的注意力矩阵和事件文本的知识感知文本表示计算得到事件文本的交互式学习文本表示。同样地,通过将事件文本的和用户查询文本的知识感知文本表示输入交互式多头注意力网络,得到用户查询文本的注意力矩阵。基于用户查询文本的注意力矩阵和用户查询文本的知识感知文本表示计算得到用户查询文本的交互式学习文本表示。
在本发明实施例中,事件文本的注意力矩阵的计算过程有用户查询文本的参与,用户查询文本的注意力矩阵的计算过程有事件文本的参与,交互式多头注意力网络实现了事件文本与用户查询文本之间的交互学习,能够有效地捕捉到事件文本与用户查询文本之间的交互信息,提供事件文本和用户查询文本的文本表示的性能。
在步骤S104中,依据事件文本的交互式学习文本表示、用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成事件文本的特定文本表示。
在本发明实施例中,动态记忆网络用于记忆过去的事件文本,依据记忆内容调整当前的注意力,以免实时事件摘要中出现大量冗余内容。动态记忆网络除了记忆过去的事件文本、调整当前的注意力、依据事件文本的交互式学习文本表示和注意力生成与记忆内容重复度低的特定文本表示之外,还包括用于更新记忆内容的循环网络,该循环网络根据上一时间戳下事件文本的记忆内容和当前时间戳下事件文本的交互式学习文本表示得到当前时间戳下事件文本的记忆内容。
在步骤S105中,将事件文本的特定文本表示输入训练好的多任务联合训练模型,生成文本流的实时事件摘要,多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型。
在本发明实施例中,将文本流中每个事件文本的特定文本表示输入至训练好的多任务联合训练模型,通过多任务联合训练模型中相关性预测任务模型计算得到文本流中每个事件文本的特定文本表示相对于用户查询文本的相关性标签,通过多任务联合训练模型中的实时事件摘要确定文本流中每个事件文本的文本动作,根据每个事件文本的文本动作生成文本流的实时事件摘要。其中,预测相关性标签包括高度相关、相关和不相关,文本动作包括推送和不推送,当文本动作为推送时将该事件文本的特定文本表示推送至实时事件摘要。
在本发明实施例中,借助知识库生成事件文本的和用户查询文本的知识感知文本表示,通过交互式多头注意力网络对这些知识感知文本进行交互式学习,生成事件文本的和用户查询文本的交互式学习文本表示,通过动态记忆网络对这些交互式学习文本表示进行处理,生成事件文本的特定文本表示,将事件文本的特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度和性能,降低了实时事件摘要的冗余度,进而提高了实时事件摘要的生成效果。
实施例二:
图2示出了本发明实施例二提供的实时事件摘要的生成方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S201中,接收文本流和用户查询文本,文本流包括按时间排序的事件文本。
在本发明实施例中,文本流可表示为D={d1,d2,…,dt,…,dT},T表示文本流中事件文本的总数,dt为文本流中第t个时间戳下的事件文本。文本流中的每个文本
Figure BDA0002073878400000071
由l个单词
Figure BDA0002073878400000072
组成(此处省略了文本的时间下缀,以简化这些参数的数学表示)。用户查询文本可表示为
Figure BDA0002073878400000073
由n个单词
Figure BDA0002073878400000074
组成。
在步骤S202中,通过提取事件文本中单词的隐藏状态,得到事件文本的初始上下文表示,通过提取用户查询文本中单词的隐藏状态,得到用户查询文本的初始上下文表示。
在本发明实施例中,通过预设的词嵌入层将事件文本中的每个单词和用户查询文本中的每个单词分别映射低维词嵌入向量。将事件文本中每个单词的低维词嵌入向量输入第一门控循环单元(GRU),计算得到事件文本中每个单词的隐藏状态。将用户查询文本中每个单词的低维词嵌入向量输入第二门控循环单元,计算得到用户查询文本中每个单词的隐藏状态。其中,第一门控循环单元与第二门控循环单元为互相独立的门控循环单元。
优选地,通过门控循环单元计算单词隐藏状态的计算公式为:
hk=GRU(hk-1,vk),其中,vk表示第k个单词的低维词嵌入向量,hk表示第k个单词的隐藏状态,hk-1表示第k-1个单词的隐藏状态。
在本发明实施例中,将事件文本中所有单词的隐藏状态组合成事件文本的初始上下文表示,将用户查询文本中所有单词的隐藏状态组合成用户查询文本的初始上下文表示。事件文本的初始上下文表示为
Figure BDA0002073878400000081
用户查询文本的初始上下文表示为
Figure BDA0002073878400000082
其中,
Figure BDA0002073878400000083
为事件文本中第i个单词
Figure BDA0002073878400000084
的隐藏状态,
Figure BDA0002073878400000085
为事件文本中第j个单词
Figure BDA0002073878400000086
的隐藏状态。
在步骤S203中,根据事件文本的初始上下文表示、注意力机制和知识库,生成事件文本的初始知识表示,根据用户查询文本的初始上下文表示、注意力机制和知识库,生成查询文本的初始知识表示。
在本发明实施例中,在知识库中为事件文本中的每个单词和用户查询文本中的每个分别选取预设数量个嵌入实体构成的候选实体集,候选实体集表示为:
Figure BDA0002073878400000087
N为嵌入实体的总数,ek为第k个单词对应的候选实体集,当单词为事件文本中的单词时k=1,2,…,l,当单词为用户查询文本中的单词时k=1,2,…,n,dkb为知识库中候选实体的维度。
在本发明实施例中,通过知识库中相应候选实体集的嵌入来学习事件文本中每个单词的知识表示,学习过程可表示为:
Figure BDA0002073878400000088
Ek d为事件文本中第k个单词的知识表示,eki为事件文本中第k个单词的候选实体集中第i个嵌入实体,aki为eki的上下文引导注意力权重,aki=softmax(ρ(eki,μ(Hd))),ρ(eki,μ(Hd))=tanh(Wkbeki+Wcμ(Hd)+bkb),μ为平均池化操作,Wkb和Wc为训练好的权重矩阵,bkb为偏置值。由事件文本中所有单词的知识表示构成事件文本的初始知识估计
Figure BDA0002073878400000091
从而通过上下文引导的注意力机制、知识库和事件文本的初始上下文表示,可得到事件文本的初始知识表示。同样地,通过上下文引导的注意力机制、知识库和用户查询文本的初始上下文表示,可得到用户查询文本的初始知识表示
Figure BDA0002073878400000092
具体可参照事件文本初始知识表示的学习过程,在此不再赘述。
在步骤S204中,由事件文本的初始上下文表示和事件文本的初始知识表示组合得到事件文本的知识感知文本表示,由用户查询文本的初始上下文表示和用户查询文本的初始知识表示组合得到用户查询文本的知识感知文本表示。
在本发明实施例中,事件文本的知识感知文本表示为:
Figure BDA0002073878400000093
用户查询文本的知识感知文本表示为:
Figure BDA0002073878400000094
在步骤S205中,将事件文本的知识感知文本表示和用户查询文本的知识感知文本表示输入交互式多头注意力网络,计算事件文本的注意力矩阵和用户查询文本的注意力矩阵。
在本发明实施例中,将事件文本的知识感知文本表示和用户查询文本的知识感知文本表示输入交互式多头注意力网络,计算得到事件文本的注意力矩阵和用户查询文本的注意力矩阵。
优选地,事件文本的注意力矩阵的计算公式表示为:
Figure BDA0002073878400000095
其中,μ为平均池化操作,
Figure BDA0002073878400000096
为事件文本中第i个单词的知识感知文本表示,Ai为事件文本的注意力矩阵A中的第i行矩阵,ρ为注意力函数,且
Figure BDA0002073878400000097
U(1)和W(1)为交互式多头注意力网络训练好的权重矩阵。
优选地,用户查询文本的注意力矩阵的计算公式表示为:
Figure BDA0002073878400000101
其中,Bi为用户查询文本的注意力矩阵B中的第i行矩阵。
在步骤S206中,根据事件文本的注意力矩阵和知识感知文本表示,计算得到事件文本的交互式学习文本表示,根据用户查询文本的注意力矩阵和知识感知文本表示,计算得到用户查询文本的交互式学习文本表示。
在本发明实施例中,事件文本的交互式学习文本表示的计算公式为od=AZd,用户查询文本的交互式学习文本表示的计算公式为oq=AZq
在步骤S207中,依据事件文本的交互式学习文本表示、用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成事件文本的特定文本表示。
在本发明实施例中,由于文本流包括按时间排序的事件文本,文本流中的每个时间戳相当于动态记忆网络的每个步长。依次针对每个时间戳,获取当前时间戳的上一个时间戳的记忆内容,将该记忆内容、当前时间戳下的事件文本的交互式学习文本表示、以及用户查询文本输入动态记忆网络,通过动态网络中的注意力机制,计算得到当前时间戳下事件文本的特定文本表示。
优选地,事件文本的特定文本表示的计算公式为:
Figure BDA0002073878400000102
其中,embt为时间戳t下事件文本的特定文本表示,otj d为时间戳t下事件文本中第j个单词的交互式学习文本表示,注意力函数wtj是一个前向神经网络,δ为用于将矩阵展平为矢量形式的函数,Wa、Ua、Va是wtj中的权重矩阵,ba为wtj中的偏置项,mt-1为时间戳t-1下事件文本的记忆内容。
优选地,根据上一时间戳下事件文本对应的记忆内容和当前时间戳下事件文本的特定文本表示,计算当前时间戳下事件文本对应的记忆内容,从而按照时间戳的顺序生成事件文本对应的记忆内容并存储在动态记忆网络中。
进一步优选地,根据上一时间戳下事件文本对应的记忆内容和当前时间戳下事件文本的特定文本表示,通过第三门控循环单元计算当前时间戳下事件文本对应的记忆内容,计算公式为:
mt=GRU(embt,mt-1)。其中,初始时间戳下时间文本对应的记忆内容为用户查询文本中最后一个单词对应的交互式学习文本表示
Figure BDA0002073878400000111
Figure BDA0002073878400000112
在步骤S208中,将事件文本的特定文本表示输入训练好的多任务联合训练模型,生成文本流的实时事件摘要,多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型。
在本发明实施例中,在多任务联合训练模型的训练过程中,相关性预测任务模型的目标函数可表示为:
Figure BDA0002073878400000113
其中,
Figure BDA0002073878400000114
分别为相关性预测任务模型中softmax层和全连接层的输出,
Figure BDA0002073878400000115
为特定文本表示embt相对于用户查询文本预测到的相关性标签,V1 r
Figure BDA0002073878400000117
为相关性预测的权重矩阵,需要在训练过程中对该权重矩阵进行训练。K为相关性标签的类别,例如当相关性标签包括高度相关、相关和不相关时K=3。I{·}是一个指示标记,I{true}=1,I{false}=0。通过有监督的方式对相关性预测任务的权重矩阵V1 r
Figure BDA0002073878400000119
进行学习,训练数据集为
Figure BDA00020738784000001110
dt和qt分别为训练数据集中时间戳t下的事件文本和用户查询文本,
Figure BDA00020738784000001111
为dt相对于qt的真实的相关性标签。通过最小化该目标函数(即预测的相关性标签与真实的相关性标签之间的交叉熵)进行训练。
在本发明实施例中,实时事件摘要任务模型的目标函数可表示为:
Figure BDA00020738784000001112
其中,RT=r(a1:T)=λEG(a1:T)+(1-λ)nCG(a1:T)为根据预测得到的相关性标签计算得到的预期奖励,表示在给定文本流和生成实时事件摘要的全局动作序列a1:T之间的分数,由于无法在得到最终的全局动作序列之前获得奖励,该预期奖励是典型的延迟奖励,r(·)为奖励函数,λ为控制函数EG(·)和函数nCG(·)的系数,
Figure BDA0002073878400000121
为策略函数,此处采用随机策略梯度算法中具有参数θ的独立函数逼近器逼近随机策略πθ,V1 s
Figure BDA0002073878400000122
为策略函数中要学习的权重矩阵,bs为偏置值,at∈{0,1}为文本动作,at=1表示将时间戳为t的事件文本的特定文本表示推送至实时事件摘要中,at=0表示不将时间戳为t的事件文本的特定文本表示推送至实时事件摘要中,st=embt。在训练过程中采用强化学习算法对实时事件摘要任务模型的目标函数进行优化,优选地,采用策略梯度算法作为优化实时事件摘要任务模型的强化学习算法,以提高实时事件摘要任务模型的训练效果。
在本发明实施例中,多任务联合训练模型可表示为:
L=γ1L12L2,L1为相关性预测任务模型的目标函数,L2为实时事件摘要任务模型的目标函数,γ1、γ2分别为L1和L2的权重系数,对多任务联合训练模型进行训练即对相关性预测任务模型和实时事件摘要任务模型进行同步训练,充分考虑到相关性预测任务和实时事件摘要任务相互依赖的关系,有效地提高实时时间摘要的生成效果。
在本发明实施例中,借助知识库生成事件文本的和用户查询文本的知识感知文本表示,通过交互式多头注意力网络对这些知识感知文本进行交互式学习,生成事件文本的和用户查询文本的交互式学习文本表示,通过动态记忆网络对这些交互式学习文本表示进行处理,生成事件文本的特定文本表示,将事件文本的特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度和性能,降低了实时事件摘要的冗余度,进而提高了实时事件摘要的生成效果。
实施例三:
图3示出了本发明实施例三提供的实时事件摘要的生成装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
文本接收模块31,用于接收文本流和用户查询文本,文本流包括按时间排序的事件文本;
知识感知表示生成模块32,用于依据事件文本、用户查询文本和预设的知识库,生成事件文本的知识感知文本表示和用户查询文本的知识感知文本表示;
交互式表示生成模块33,用于依据事件文本的知识感知文本表示、用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成事件文本的交互式学习文本表示和用户查询文本的交互式学习文本表示;
特定表示生成模块34,用于依据事件文本的交互式学习文本表示、用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成事件文本的特定文本表示;以及
实时摘要生成模块35,用于将事件文本的特定文本表示输入训练好的多任务联合训练模型,生成文本流的实时事件摘要,多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型。
优选地,如图4所示,知识感知表示生成模块32包括:
上下文生成模块321,用于通过提取事件文本中单词的隐藏状态,得到事件文本的初始上下文表示,通过提取用户查询文本中单词的隐藏状态,得到用户查询文本的初始上下文表示;
初始知识表示生成模块322,用于根据事件文本的初始上下文表示、注意力机制和知识库,生成事件文本的初始知识表示,根据用户查询文本的初始上下文表示、注意力机制和知识库,生成查询文本的初始知识表示;以及
知识感知表示组合模块323,用于由事件文本的初始上下文表示和事件文本的初始知识表示组合得到事件文本的知识感知文本表示,由用户查询文本的初始上下文表示和用户查询文本的初始知识表示组合得到用户查询文本的知识感知文本表示。
优选地,交互式表示生成模块33包括:
注意力矩阵计算模块,用于将事件文本的知识感知文本表示和用户查询文本的知识感知文本表示输入交互式多头注意力网络,计算事件文本的注意力矩阵和用户查询文本的注意力矩阵;以及
交互式表示生成子模块,用于根据事件文本的注意力矩阵和知识感知文本表示,计算得到事件文本的交互式学习文本表示,根据用户查询文本的注意力矩阵和知识感知文本表示,计算得到用户查询文本的交互式学习文本表示。
优选地,特定表示生成模块34包括:
记忆内容获取模块,用于获取文本流中上一时间戳下的事件文本的记忆内容;以及
特定表示生成子模块,用于将上一时间戳下事件文本的记忆内容、当前时间戳下事件文本的交互式学习文本表示和用户查询文本的交互式学习文本表示输入动态记忆网络,获得当前时间戳下事件文本的特定文本表示。
优选地,特定表示生成模块34还包括:
记忆内容计算模块,用于根据当前时间戳下事件文本的特定文本表示和上一时间戳下事件文本的记忆内容,计算当前时间戳下事件文本的记忆内容。
优选地,实时事件摘要的生成装置还包括:
训练模块,用于获取训练数据,根据训练数据对实时事件摘要任务与相关性预测任务进行同时训练,实时事件摘要任务采用策略梯度算法进行训练,相关性预测任务采用有监督方式进行训练。
在本发明实施例中,借助知识库生成事件文本的和用户查询文本的知识感知文本表示,通过交互式多头注意力网络对这些知识感知文本进行交互式学习,生成事件文本的和用户查询文本的交互式学习文本表示,通过动态记忆网络对这些交互式学习文本表示进行处理,生成事件文本的特定文本表示,将事件文本的特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度和性能,降低了实时事件摘要的冗余度,进而提高了实时事件摘要的生成效果。
在本发明实施例中,实时事件摘要的生成装置的各单元的实施内容可参照实施例一、实施例二相应步骤的详细描述,在此不再赘述。
在本发明实施例中,实时事件摘要的生成装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例四:
图5示出了本发明实施例四提供的计算机设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的计算机设备5包括处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。该处理器50执行计算机程序52时实现上述各个方法实施例中的步骤,例如图1所示的步骤S101至S105。或者,处理器50执行计算机程序52时实现上述装置实施例中各单元的功能,例如图3所示单元31至35的功能。
在本发明实施例中,借助知识库生成事件文本的和用户查询文本的知识感知文本表示,通过交互式多头注意力网络对这些知识感知文本进行交互式学习,生成事件文本的和用户查询文本的交互式学习文本表示,通过动态记忆网络对这些交互式学习文本表示进行处理,生成事件文本的特定文本表示,将事件文本的特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度和性能,降低了实时事件摘要的冗余度,进而提高了实时事件摘要的生成效果。
实施例五:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例中的步骤,例如,图1所示的步骤S101至S105。或者,该计算机程序被处理器执行时实现上述装置实施例中各单元的功能,例如图3所示单元31至35的功能。
在本发明实施例中,借助知识库生成事件文本的和用户查询文本的知识感知文本表示,通过交互式多头注意力网络对这些知识感知文本进行交互式学习,生成事件文本的和用户查询文本的交互式学习文本表示,通过动态记忆网络对这些交互式学习文本表示进行处理,生成事件文本的特定文本表示,将事件文本的特定文本表示输入多任务联合训练模型,生成文本流的实时事件摘要,从而有效地提高了实时事件摘要的内容丰富度和性能,降低了实时事件摘要的冗余度,进而提高了实时事件摘要的生成效果。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种实时事件摘要的生成方法,其特征在于,所述方法包括下述步骤:
接收文本流和用户查询文本,所述文本流包括按时间排序的事件文本;
依据所述事件文本、所述用户查询文本和预设的知识库,生成所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示;
依据所述事件文本的知识感知文本表示、所述用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成所述事件文本的交互式学习文本表示和所述用户查询文本的交互式学习文本表示;
依据所述事件文本的交互式学习文本表示、所述用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成所述事件文本的特定文本表示;
将所述事件文本的特定文本表示输入训练好的多任务联合训练模型,生成所述文本流的实时事件摘要,所述多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型;
其中,所述生成所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示的步骤,包括:
通过提取所述事件文本中单词的隐藏状态,得到所述事件文本的初始上下文表示,通过提取所述用户查询文本中单词的隐藏状态,得到所述用户查询文本的初始上下文表示;
根据所述事件文本的初始上下文表示、注意力机制和所述知识库,生成所述事件文本的初始知识表示,根据所述用户查询文本的初始上下文表示、注意力机制和所述知识库,生成所述查询文本的初始知识表示;
由所述事件文本的初始上下文表示和所述事件文本的初始知识表示组合得到所述事件文本的知识感知文本表示,由所述用户查询文本的初始上下文表示和所述用户查询文本的初始知识表示组合得到所述用户查询文本的知识感知文本表示。
2.如权利要求1所述的方法,其特征在于,所述生成所述事件文本的交互式学习文本表示和所述用户查询文本的交互式学习文本表示的步骤,包括:
将所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示输入所述交互式多头注意力网络,计算所述事件文本的注意力矩阵和所述用户查询文本的注意力矩阵;
根据所述事件文本的注意力矩阵和知识感知文本表示,计算得到所述事件文本的交互式学习文本表示,根据所述用户查询文本的注意力矩阵和知识感知文本表示,计算得到所述用户查询文本的交互式学习文本表示。
3.如权利要求1所述的方法,其特征在于,所述生成所述事件文本的特定文本表示的步骤,包括:
获取所述文本流中上一时间戳下的事件文本的记忆内容;
将所述上一时间戳下事件文本的记忆内容、当前时间戳下事件文本的交互式学习文本表示和用户查询文本的交互式学习文本表示输入动态记忆网络,获得所述当前时间戳下事件文本的特定文本表示。
4.如权利要求3所述的方法,其特征在于,所述生成所述事件文本的特定文本表示的步骤,还包括:
根据所述当前时间戳下事件文本的特定文本表示和所述上一时间戳下事件文本的记忆内容,计算所述当前时间戳下事件文本的记忆内容。
5.如权利要求1所述的方法,其特征在于,在所述接收文本流和用户查询文本的步骤之前,所述方法还包括:
获取训练数据,根据所述训练数据对所述实时事件摘要任务与所述相关性预测任务进行同时训练,所述实时事件摘要任务采用策略梯度算法进行训练,所述相关性预测任务采用有监督方式进行训练。
6.一种实时事件摘要的生成装置,其特征在于,所述装置包括:
文本接收模块,用于接收文本流和用户查询文本,所述文本流包括按时间排序的事件文本;
知识感知表示生成模块,用于依据所述事件文本、所述用户查询文本和预设的知识库,生成所述事件文本的知识感知文本表示和所述用户查询文本的知识感知文本表示;
交互式表示生成模块,用于依据所述事件文本的知识感知文本表示、所述用户查询文本的知识感知文本表示和训练好的交互式多头注意力网络,生成所述事件文本的交互式学习文本表示和所述用户查询文本的交互式学习文本表示;
特定表示生成模块,用于依据所述事件文本的交互式学习文本表示、所述用户查询文本的交互式学习文本表示和训练好的动态记忆网络,生成所述事件文本的特定文本表示;以及
实时摘要生成模块,用于将所述事件文本的特定文本表示输入训练好的多任务联合训练模型,生成所述文本流的实时事件摘要,所述多任务联合训练模型包括实时事件摘要任务模型和相关性预测任务模型;
其中,所述知识感知表示生成模块包括:
上下文生成模块,用于通过提取所述事件文本中单词的隐藏状态,得到所述事件文本的初始上下文表示,通过提取所述用户查询文本中单词的隐藏状态,得到所述用户查询文本的初始上下文表示;
初始知识表示生成模块,用于根据所述事件文本的初始上下文表示、注意力机制和所述知识库,生成所述事件文本的初始知识表示,根据所述用户查询文本的初始上下文表示、注意力机制和所述知识库,生成所述查询文本的初始知识表示;以及
知识感知表示组合模块,用于由所述事件文本的初始上下文表示和所述事件文本的初始知识表示组合得到所述事件文本的知识感知文本表示,由所述用户查询文本的初始上下文表示和所述用户查询文本的初始知识表示组合得到所述用户查询文本的知识感知文本表示。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201910446730.7A 2019-05-27 2019-05-27 实时事件摘要的生成方法、装置、设备及存储介质 Active CN110297885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910446730.7A CN110297885B (zh) 2019-05-27 2019-05-27 实时事件摘要的生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910446730.7A CN110297885B (zh) 2019-05-27 2019-05-27 实时事件摘要的生成方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110297885A CN110297885A (zh) 2019-10-01
CN110297885B true CN110297885B (zh) 2021-08-17

Family

ID=68027356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910446730.7A Active CN110297885B (zh) 2019-05-27 2019-05-27 实时事件摘要的生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110297885B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11436501B1 (en) * 2019-08-09 2022-09-06 Bottomline Technologies, Inc. Personalization of a user interface using machine learning
CN111723196B (zh) * 2020-05-21 2023-03-24 西北工业大学 基于多任务学习的单文档摘要生成模型构建方法及装置
CN113515935B (zh) * 2020-07-21 2023-11-07 腾讯科技(深圳)有限公司 一种标题生成方法、装置、终端及介质
CN115622047B (zh) * 2022-11-04 2023-07-18 中海储能科技(北京)有限公司 基于Transformer模型的电力变压器负荷预测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838140A (zh) * 2005-03-25 2006-09-27 威盛电子股份有限公司 运用加密功能以产生信息摘要的设备及方法
CN101470728A (zh) * 2007-12-25 2009-07-01 北京大学 一种中文新闻网页正文的自动抽取方法及装置
CN106484767A (zh) * 2016-09-08 2017-03-08 中国科学院信息工程研究所 一种跨媒体的事件抽取方法
CN108763535A (zh) * 2018-05-31 2018-11-06 科大讯飞股份有限公司 信息获取方法及装置
CN108921657A (zh) * 2018-06-25 2018-11-30 中国人民大学 一种基于知识增强记忆网络的序列推荐方法
CN109558477A (zh) * 2018-10-23 2019-04-02 深圳先进技术研究院 一种基于多任务学习的社区问答系统、方法及电子设备
CN109670035A (zh) * 2018-12-03 2019-04-23 科大讯飞股份有限公司 一种文本摘要生成方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767525B2 (en) * 2013-12-18 2017-09-19 LifeJourney USA, LLC Methods and systems for providing career inspiration, motivation and guidance to a user
US11017687B2 (en) * 2017-01-31 2021-05-25 Ent. Services Development Corporation Lp Information technology user behavior monitoring rule generation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1838140A (zh) * 2005-03-25 2006-09-27 威盛电子股份有限公司 运用加密功能以产生信息摘要的设备及方法
CN101470728A (zh) * 2007-12-25 2009-07-01 北京大学 一种中文新闻网页正文的自动抽取方法及装置
CN106484767A (zh) * 2016-09-08 2017-03-08 中国科学院信息工程研究所 一种跨媒体的事件抽取方法
CN108763535A (zh) * 2018-05-31 2018-11-06 科大讯飞股份有限公司 信息获取方法及装置
CN108921657A (zh) * 2018-06-25 2018-11-30 中国人民大学 一种基于知识增强记忆网络的序列推荐方法
CN109558477A (zh) * 2018-10-23 2019-04-02 深圳先进技术研究院 一种基于多任务学习的社区问答系统、方法及电子设备
CN109670035A (zh) * 2018-12-03 2019-04-23 科大讯飞股份有限公司 一种文本摘要生成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Generative Adversarial Network for Abstractive Text Summarization;Linqing Liu 等;《arXiv preprint arXiv:1711.09357》;20171126;1-3 *
MARES: multitask learning algorithm for Web-scale real-time event summarization;Yang Min 等;《World Wide Web》;20190228;第22卷(第2期);499-515 *
改进的递归网络及其在汉语语言处理中的应用;全志斌;《中国博士学位论文全文数据库 信息科技辑》;20190515;I138-78 *

Also Published As

Publication number Publication date
CN110297885A (zh) 2019-10-01

Similar Documents

Publication Publication Date Title
CN110297885B (zh) 实时事件摘要的生成方法、装置、设备及存储介质
CN107515909B (zh) 一种视频推荐方法及系统
CN107273438B (zh) 一种推荐方法、装置、设备及存储介质
Chen et al. Deep reinforcement learning in recommender systems: A survey and new perspectives
US11741711B2 (en) Video classification method and server
CN111143576A (zh) 一种面向事件的动态知识图谱构建方法和装置
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
CN111274790B (zh) 基于句法依存图的篇章级事件嵌入方法及装置
Burdisso et al. τ-SS3: A text classifier with dynamic n-grams for early risk detection over text streams
CN111859149A (zh) 资讯信息推荐方法、装置、电子设备及存储介质
Chen et al. Delving deeper into the decoder for video captioning
CN111723295B (zh) 一种内容分发方法、装置和存储介质
CN111563158A (zh) 文本排序方法、排序装置、服务器和计算机可读存储介质
CN112749330B (zh) 信息推送方法、装置、计算机设备和存储介质
Wei et al. Exploiting the local temporal information for video captioning
Liu et al. Heterogeneous relational graph neural networks with adaptive objective for end-to-end task-oriented dialogue
CN111078881B (zh) 细粒度情感分析方法、系统、电子设备和存储介质
CN112015947A (zh) 一种语言描述引导的视频时序定位方法、系统
Garg et al. Reinforced approximate exploratory data analysis
CN112231554A (zh) 一种搜索推荐词生成方法、装置、存储介质和计算机设备
CN114511813B (zh) 视频语义描述方法及装置
US20230237093A1 (en) Video recommender system by knowledge based multi-modal graph neural networks
US20220237682A1 (en) Scalable architecture for recommendation
Evans et al. Bad students make great teachers: Active learning accelerates large-scale visual understanding
WO2020237479A1 (zh) 实时事件摘要的生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240130

Address after: 519085 101, Building 5, Longyuan Smart Industrial Park, No. 2, Hagongda Road, Tangjiawan Town, High-tech Zone, Zhuhai City, Guangdong Province

Patentee after: ZHUHAI INSTITUTE OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES Co.,Ltd.

Country or region after: China

Address before: 518000 No. 1068, Xue Yuan Avenue, Shenzhen University Town, Nanshan District, Shenzhen, Guangdong.

Patentee before: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES

Country or region before: China