CN109800413A

CN109800413A - 新闻事件的识别方法、装置、设备及可读存储介质

Info

Publication number: CN109800413A
Application number: CN201811509289.4A
Authority: CN
Inventors: 潘禄; 陈玉光; 彭卫华; 罗雨; 陈亮; 陈文浩; 周辉; 郑宇宏; 陈伟娜; 韩翠云
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-12-11
Filing date: 2018-12-11
Publication date: 2019-05-24

Abstract

本申请实施例提供了一种新闻事件的识别方法、装置、设备及可读存储介质。该方法包括：采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征；获取目标新闻资讯文本的事件主体特征及用户搜索行为特征；根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别，由于在进行目标新闻资讯文本的识别时，获取了是否包含事件关键特征，将这些特征采用优化的深度学习模型进行特征学习和识别，优化的深度学习模型能够将特征学习融入到模型训练中，自动从数据中学习合适的特征，减少了特征学习的时间，提高了识别的效率，并且提高了新闻事件识别的准确率。

Description

新闻事件的识别方法、装置、设备及可读存储介质

技术领域

本申请实施例涉及数据处理技术领域，尤其涉及一种新闻事件的识别方法、装置、设备及可读存储介质。

背景技术

随着互联网的快速普及，网络信息呈爆炸式增长，每个人需要花费大量的精力去对信息进行筛选。当用户想要了解近期发生的事情，或者关注某个人、某个组织时，需要从大量未经过筛选整理的新闻资讯中，挑选出重要的信息。如果能够自动的从资讯中将非事件(比如广告、健康知识等)去掉，仅将包含事件的资讯呈现给用户，就能够大大减少用户信息筛选的成本，能够以最快的速度了解外界发生的变化。

现有技术中利用文本内容和时间戳这两个信息识别新闻资讯是否为新闻事件。具体地，事件可以表示为{参与者，地点，关键词，时间戳}的集合，对参与者、地点、关键词、时间戳单独建立概率模型，采用概率模型对文本内容进行特征提取，通过朴素贝叶斯分类器识别新闻资讯中是否为新闻事件。

现有的新闻事件的识别方法，由于提取文本中的参与者，地点，关键词，时间戳的构成的事件因素建立概率模型，会引入大量的噪声信息。并且现有技术中并没有考虑文本中是否包括事件的一个重要特征是文本中潜在的实体和动作之间是否有关联，导致了现有技术中的识别准确率较低，并且现有技术中采用传统的机器学习方法训练模型，需要做非常多的特征工程，特征工程是一个非常耗时耗力且目前难以找到合适分类的特征，导致识别的时间较长，准确率较低。

发明内容

本申请实施例提供一种新闻事件的识别方法、装置、设备及可读存储介质。解决了现有技术中的新闻事件的识别方法中识别的时间较长，准确率较低的技术问题。

本申请实施例第一方面提供一种新闻事件的识别方法，包括：

采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征；

获取所述目标新闻资讯文本的事件主体特征及用户搜索行为特征；

根据所述句子上下文特征，所述事件主体特征及所述用户搜索行为特征采用所述优化的深度学习模型对所述目标新闻资讯文本进行是否为新闻事件的识别。

本申请实施例第二方面提供一种新闻事件的识别装置，包括：

句子上下文特征提取模块，用于采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征；

事件主体特征获取模块，用于获取所述目标新闻资讯文本的事件主体特征；

用户搜索行为特征获取模块，用于获取所述目标新闻资讯文本的用户搜索行为特征；

新闻事件识别模块，用于根据所述句子上下文特征，所述事件主体特征及所述用户搜索行为特征采用所述优化的深度学习模型对所述目标新闻资讯文本进行是否为新闻事件的识别。

本申请实施例第三方面提供一种电子设备，存储器，处理器以及计算机程序；其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如第一方面中任一项所述的方法。

本申请实施例第四方面提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行如上述第一方面所述的方法。

基于以上各方面，本申请实施例通过采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征；获取目标新闻资讯文本的事件主体特征及用户搜索行为特征；根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别，由于在进行目标新闻资讯文本的识别时，获取了是否包含事件的关键特征：事件主体特征和句子上下文特征，并且用户搜索行为特征也反映是否包含事件的特征，将这些特征采用优化的深度学习模型进行特征学习和识别，优化的深度学习模型能够将特征学习融入到模型训练中，自动从数据中学习合适的特征，减少了特征学习的时间，提高了识别的效率，并且提高了新闻事件识别的准确率。

应当理解，上述发明内容部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征，亦非用于限制本申请的范围。本申请的其它特征将通过以下的描述变得容易理解。

附图说明

图1为本申请实施例提供的新闻事件的识别方法的一种应用场景图；

图2为本申请实施例一提供的新闻事件的识别方法的流程图；

图3为本申请实施例二提供的新闻事件的识别方法的流程图；

图4为本申请实施例二中采用优化的卷积神经网络模型进行识别的流程示意图；

图5为本申请实施例二提供的新闻事件的识别方法中步骤305的流程图；

图6为本申请实施例二提供的新闻事件的识别方法中步骤305b的流程图；

图7为本申请实施例二提供的新闻事件的识别方法中步骤305b2的流程图；

图8为本申请实施例二提供的新闻事件的识别方法中步骤305b3的流程图；

图9为本申请实施例二提供的新闻事件的识别方法中步骤306的流程图；

图10为本申请实施例二提供的新闻事件的识别方法中步骤307的流程图；

图11为本申请实施例二提供的新闻事件的识别方法中步骤308的流程图；

图12为本申请实施例三提供的新闻事件的识别装置的结构示意图；

图13为本申请实施例四提供的新闻事件的识别装置的结构示意图；

图14为本申请实施例五提供的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例，然而应当理解的是，本申请可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是，本申请的附图及实施例仅用于示例性作用，并非用于限制本申请的保护范围。

本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了清楚理解本申请的技术方案，下面对本申请中涉及的算法进行解释：

深度学习模型：深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。深度学习概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

下面对本申请实施例提供的新闻事件的识别方法的应用场景进行介绍。图1为本申请实施例提供的新闻事件的识别方法的一种应用场景图，如图1所示，用户在浏览新闻资讯时，经常会出现广告，健康知识等非事件类新闻资讯。用户需要从未经筛选的新闻资讯中，剔除掉非事件类新闻资讯。本实施例中，在将新闻资讯通过终端设备展示给用户前，均作为目标新闻资讯文本，通过优化的深度学习模型对每个目标新闻资讯文本进行是否为事件新闻资讯的识别，被识别出的非事件新闻资讯被删除，被识别出的事件新闻资讯展示在用户终端设备上，便于用户对新闻资讯的浏览，提高用户浏览新闻资讯的体验，并且采用深度学习模型能够对目标新闻资讯文本是否为事件新闻资讯进行有效的识别。

以下将参照附图来具体描述本申请的实施例。

实施例一

图2为本申请实施例一提供的新闻事件的识别方法的流程图，如图2所示，本申请实施例的执行主体为新闻事件的识别装置，该新闻资讯的识别装置可集成在电子设备中，电子设备可以为计算机，服务器，移动终端等具有独立计算和处理能力的设备。则本实施例提供的新闻事件的识别方法包括以下几个步骤。

步骤201，采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征。

其中，优化的深度学习模型为采用训练集对深度学习模型进行训练后的深度学习模型。本实施例中对深度学习模型的类型不作限定，如可以为卷积神经网络模型，深度神经网络模型，循环神经网络模型等。

其中，句子上下文特征表示目标新闻资讯文本的上下文特征。

本实施例中，目标新闻资讯文本可以为目标新闻资讯的标题或正文等，本实施例中对此不作限定。

具体地，本实施例中，采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征可以为采用优化的深度学习模型的前几层网络模型提取目标新闻资讯文本的句子上下文特征，若优化的深度学习模型为优化的卷积神经网络模型，则可采用优化的卷积神经网络模型的输入层和卷积层提取目标新闻资讯文本的句子上下文特征。也可采用其他优化的深度学习模型的前几层网络模型提取目标新闻资讯文本的句子上下文特征，本实施例中对此不作限定。

步骤202，获取目标新闻资讯文本的事件主体特征及用户搜索行为特征。

其中，事件主体特征表示事件实体和动作间关联关系的特征。事件主体特征可以为名词动词对向量，还可以为其他事件实体和动作间关联关系的特征，本实施例中对此不作限定。用户搜索行为特征表示用户对目标新闻资讯文本搜索行为的特征，如可以为访问量特征、点击量特征等。

本实施例中，获取目标新闻资讯文本的事件主体特征的方法可以为获取目标新闻资讯文本中的表征实体和表征动作的词之间的关联关系，确定事件主体特征，还可以为获取有依存关系的名词和动词形成的名词动词对，以确定事件主体特征，本实施例中对获取目标新闻资讯文本的事件主体特征的方式不作限定。

本实施例中，获取目标新闻资讯文本的用户搜索行为特征的方法可以为获取目标新闻资讯文本的其他用户的访问量、点击量，以确定该目标新闻资讯文本的用户搜索行为特征。本实施例中，获取目标新闻资讯文本的用户搜索行为特征的方法还可以为其他方法，本实施例中对此不作限定。

步骤203，根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别。

具体地，本实施例中，可将句子上下文特征，事件主体特征及用户搜索行为特征输入到优化的深度学习模型中，优化的深度学习模型根据句子上下文特征，事件主体特征及用户搜索行为特征对目标新闻资讯文本进行识别，输出目标新闻资讯文本是否为新闻事件的结果。

本实施例提供的新闻事件的识别方法，通过采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征；获取目标新闻资讯文本的事件主体特征及用户搜索行为特征；根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别，由于在进行目标新闻资讯文本的识别时，获取了是否包含事件的关键特征：事件主体特征和句子上下文特征，并且用户搜索行为特征也反映是否包含事件的特征，将这些特征采用优化的深度学习模型进行特征学习和识别，优化的深度学习模型能够将特征学习融入到模型训练中，自动从数据中学习合适的特征，减少了特征学习的时间，提高了识别的效率，并且提高了新闻事件识别的准确率。

实施例二

图3为本申请实施例二提供的新闻事件的识别方法的流程图，如图3所示，本实施例提供的新闻事件的识别方法，是在本申请实施例一提供的新闻事件的识别方法的基础上，对步骤201-步骤203的进一步细化，并且还包括了对深度学习模型进行训练的步骤。则本实施例提供的新闻事件的识别方法包括以下步骤。

步骤301，构建深度学习模型的训练集，训练集中的训练样本包括：事件新闻资讯文本和非事件新闻资讯文本。

进一步地，图4为本申请实施例二中采用优化的卷积神经网络模型进行识别的流程示意图，如图4所示，本实施例中，深度学习模型为卷积神经网络模型，卷积神经网络模型包括：输入层，卷积层，全连接层及输出层。

具体地，本实施例中，获取已被标注事件新闻资讯文本和非事件新闻资讯文本，每个新闻资讯文本为一个训练样本，所有训练样本为深度学习模型的训练集。

步骤302，采用深度学习模型提取训练样本的句子上下文特征。

进一步地，本实施例中，句子上下文特征为句子上下文向量。采用深度学习模型的输入层和卷积层提取训练样本的句子上下文特征。具体地，输入层将训练样本进行分词处理，以获取训练样本的每个词语，输入层对训练样本中每个词语进行向量化处理，获得训练样本中每个词语的总向量，总向量由词向量，位置向量及词性向量拼接而成，卷积层对训练样本中每个词语的总向量进行卷积处理，以提取训练样本中每个词语的局部特征向量，卷积层对训练样本中每个词语的局部特征向量进行池化处理，以获得训练样本中每个词语的最优特征值，卷积层对训练样本中所有词语的最优特征值进行非线性变换，获得训练样本的句子上下文向量。

进一步地，本实施例中，输入层对训练样本中每个词语进行向量化处理，获得每个词语的总向量，具体包括：首先，输入层对训练样本中每个词语进行词向量化处理，以获得训练样本中每个词语的词向量。其次，输入层对训练样本中每个词语进行位置向量化处理，以获得训练样本中每个词语的位置向量。最后，输入层对训练样本中每个词语进行词性向量化处理，以获得训练样本中每个词语的词性向量。

优选地，本实施例中，输入层对训练样本中每个词语进行词向量化处理，以获得每个词语的词向量，具体为：

输入层中的词向量模型对训练样本中每个词语进行词向量识别，输出训练样本中每个词语的词向量。词向量模型是通过新闻资讯文本中的语料训练获得的。

具体地，本实施例中，在输入层中包括词向量模型，该词向量模型可以为采用无监督模型对新闻资讯文本中的语料训练获得的，将训练样本中每个词语输入到词向量模型，词向量模型对训练样本中每个词语进行识别，输出训练样本中每个词语对应的词向量。

优选地，本实施例中，输入层对训练样本中每个词语进行位置向量化处理，以获得每个词语的位置向量，具体包括：

首先，输入层识别训练样本中的第一预设个数的实体和第二预设个数的动词。

其次，输入层计算训练样本每个词语与实体和动词的相对位置。

最后，输入层将相对位置映射到正态分布向量上，形成训练样本每个词语的位置向量。

具体地，本实施例中，对每个训练样本进行分词，根据实体和动词的特征识别每个训练样本中的实体和动词，若实体或动词的个数多于对应的预设个数，则采用依存分析工具筛选出具有依存关系的实体和动词，若实体和动词间具有直接关系，则将该实体和动词优先选择，否则按照顺序进行选择。若不够对应的预设个数，则使用特定的向量表示实体或动词。计算训练样本中每个词语与实体的相对位置，以及训练样本中每个词语与动词的相对位置，然后将所有的相对位置映射到正态分布向量上，形成训练样本中每个词语的位置向量。

举例说明为：识别训练样本中的实体的第一预设个数为3个，动词的第二预设个数为2个，某个词语为当前训练样本中的第4个词，某个识别的实体在该训练样本中的位置为7，该词语相对于该实体的位置是-4，则将-4映射到一个固定维度的正态分布向量上，同理，将该训练样本的其他词语与实体和动词的相对位置也映射到一个固定维度的正态分布向量上，这些映射后的向量形成每个词语的位置向量。其中，表征不同相对位置的数字映射为不同的向量。

优选地，本实施例中，输入层对训练样本中每个词语进行词性向量化处理，以获得每个词语的词性向量，具体为：

首先，输入层确定训练样本中每个词语的词性。

其次，输入层将训练样本中每个词语的词性映射为对应的词性向量。

具体地，本实施例中，首先，输入层可根据预先存储的所有词语的词性的数据库确定训练样本中每个词语的词性，也可根据其他方法确定训练样本中每个词语的词性，本实施例中不作限定。其次，每个词语的词性具有相应的词性向量，将训练样本中每个词语的词性映射为对应的词性向量。

步骤303，获取训练样本的事件主体特征及用户搜索行为特征。

进一步地，本实施例中，事件主体特征为名词动词对向量，获取训练样本的事件主体特征，具体包括：

首先，采用依存分析工具获取训练样本中各词语的依存关系。

其次，选取第三预设个数的有依存关系的名词和动词形成名词动词对。

最后，将名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量。

具体地，本实施例中，在事件中事件主体是重要的信息，因此加入这部分信息有助于识别是否为新闻事件，由于事件的参与者是由名词构成的，事件的动作是由动词构成的，所以本实施例中，首先采用依存分析工具获取训练样本中各词语的依存关系，将名词和动词具有直接关系的优先选择，若名词和动词间有依存关系但不是直接的关系，则顺序选择，选择出第三预设个数的依存关系的名词和动词，将名词和动词拼接在一起作为多个名词动词对，最后将每个名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量，若训练样本中的名词动词对没有达到第三预设个数，则使用零向量进行补充。

其中，第三预设个数可以为3个，或者其他适宜的数值，本实施例中对此不作限定。

进一步地，本实施例中，用户搜索行为特征为资讯访问量向量，获取训练样本的用户搜索行为特征，具体包括：

首先，计算训练样本与预设范围内新闻资讯文本的相似度。

其中，预设范围的新闻资讯文本可以为预设新闻网站中当天出现的新闻资讯文本，预设范围的新闻资讯文本也可以为其他范围的新闻资讯文本，本实施例中对此不作限定。

进一步地，本实施例中，可采用SimHash算法计算训练样本与预设范围内新闻资讯文本的相似度。

其次，获取训练样本和相似度大于预设相似阈值的新闻资讯文本的链接点击次数。

进一步地，本实施例中，相似度大于预设相似阈值的新闻资讯文本为与训练样本相似的新闻资讯文本，获取训练样本和相似的新闻资讯文本的对应的链接总的点击次数作为训练样本的资讯访问量。

最后，将链接点击次数对应的向量确定为资讯访问量向量。

进一步地，预先存储每个范围的链接点击次数对应的多维向量表示，确定链接点击次数落入的链接点击次数的范围，根据落入的链接点击次数的范围确定该训练样本对应的资讯访问量向量。

步骤304，根据训练样本的句子上下文特征，事件主体特征及用户搜索行为特征对深度学习模型进行训练，直到深度学习模型中的参数达到最优参数为止，以获得优化后的深度学习模型。

进一步地，本实施例中，卷积神经网络的全连接层根据每个训练样本的句子上下文特征，事件主体特征及用户搜索行为特征采用softmax分类器对训练集中的训练样本进行分类，根据分类结果训练卷积神经网络中的各网络层的参数，直到各网络层的参数达到最优，模型收敛，该训练后的收敛的卷积神经网络模型为优化的神经网络模型。

步骤305，采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征。

进一步地，本实施例中，优化的深度学习模型为优化的卷积神经网络模型，优化的卷积神经网络模型包括：输入层和卷积层；句子上下文特征为句子上下文向量。图5为本申请实施例二提供的新闻事件的识别方法中步骤305的流程图，如图5所示，本实施例中，步骤305包括以下几个步骤。

步骤305a，输入层将目标新闻资讯文本进行分词处理，以获取目标新闻资讯文本的每个词语。

进一步地，本实施例中，在输入层中采用分词工具对目标新闻资讯文本进行分词处理，分词处理后，目标新闻资讯文本被分成多个词语。

步骤305b，输入层对每个词语进行向量化处理，获得每个词语的总向量，总向量由词向量，位置向量及词性向量拼接而成。

进一步地，本实施例中，图6为本申请实施例二提供的新闻事件的识别方法中步骤305b的流程图，如图6所示，步骤305b具体包括以下步骤：

步骤305b1，输入层对每个词语进行词向量化处理，以获得每个词语的词向量。

优选地，本实施例中，输入层对每个词语进行词向量化处理，以获得每个词语的词向量，具体为：

输入层中的词向量模型对每个词语进行词向量识别，输出每个词语的词向量；

其中，词向量模型是通过新闻资讯文本中的语料训练获得的。

具体地，本实施例中，在输入层中包括词向量模型，该词向量模型可以为采用无监督模型对新闻资讯文本中的语料训练获得的，将目标新闻资讯文本中的每个词语输入到词向量模型，词向量模型对每个词语进行识别，输出每个词语对应的词向量。

步骤305b2，输入层对每个词语进行位置向量化处理，以获得每个词语的位置向量。

优选地，图7为本申请实施例二提供的新闻事件的识别方法中步骤305b2的流程图，如图7所示，本实施例中，步骤305b2具体包括以下步骤：

305b21，输入层识别目标新闻资讯文本中的第一预设个数的实体和第二预设个数的动词。

305b22，输入层计算每个词语与实体和动词的相对位置；

305b23，输入层将相对位置映射到正态分布向量上，形成每个词语的位置向量。

具体地，本实施例中，对目标新闻资讯文本进行分词，根据实体和动词的特征识别目标新闻资讯文本中的实体和动词，若实体或动词的个数多于对应的预设个数，则采用依存分析工具筛选出具有依存关系的实体和动词，若实体和动词间具有直接关系，则将该实体和动词优先选择，否则按照顺序进行选择。若不够对应的预设个数，则使用特定的向量表示实体和动词。计算目标新闻资讯文本中每个词语与实体的相对位置，以及每个词语与动词的相对位置，然后将所有的相对位置映射到正态分布向量上，形成目标新闻资讯文本每个词语的位置向量。

其中，第一预设个数可以为3个，第二预设个数可以为2个，或者第一预设个数和第二预设个数为其他适宜的数值，本实施例中对此不作限定。

步骤305b3，输入层对每个词语进行词性向量化处理，以获得每个词语的词性向量。

优选地，图8为本申请实施例二提供的新闻事件的识别方法中步骤305b3的流程图，如图8所示，本实施例中，步骤305b3具体包括以下步骤：

步骤305b31，输入层确定每个词语的词性。

步骤305b32，输入层将每个词语的词性映射为对应的词性向量。

具体地，本实施例中，首先，输入层可根据预先存储的每个词语的词性的数据库确定目标新闻资讯文本的每个词语的词性，也可根据其他方法确定目标新闻资讯文本的每个词语的词性，本实施例中不作限定。其次，每个词语的词性具有相应的词性向量，将每个词语的词性映射为对应的词性向量。

步骤305c，卷积层对每个词语的总向量进行卷积处理，以提取每个词语的局部特征向量。

进一步地，卷积层的作用是通过多个卷积核提取每个词语的局部特征，本实施例中，卷积层通过多个卷积核对每个词语的总向量作卷积处理，同时为了避免卷积层中的网络模型中的参数过多，采用卷积窗口为3的卷积层提取每个词语的局部特征。并且采用了等长卷积核。

本实施例中可预先设定提取的局部特征的数量。

步骤305d，卷积层对每个词语的局部特征向量进行池化处理，以获得每个词语的最优特征值。

进一步地，本实施例中，卷积层对每个词语的局部特征向量进行池化处理，获取每个词语的局部特征向量的相同位置的最优的特征值，优选地，本实施例中卷积层对每个词语的局部特征向量进行最大池化处理，获取每个词语的局部特征向量的相同位置的最大的特征值作为最优特征值。

本实施例中，由每个词语的最优特征值构成该目标新闻资讯文本的最优特征向量。

步骤305e，卷积层对所有词语的最优特征值进行非线性变换，获得句子上下文向量。

优选地，本实施例中，卷积层对所有词语的最优特征值进行非线性变换，获得句子上下文向量，具体为：

卷积层对所有词语的最优特征值进行双曲正切变换，获得句子上下文向量。

具体地，本实施例中，卷积层对所有词语的最优特征值组成的最优特征向量进行双曲正切变换，获得的向量为句子上下文向量。

步骤306，获取目标新闻资讯文本的事件主体特征。

进一步地，本实施例中，事件主体特征为名词动词对向量。

相应地，图9为本申请实施例二提供的新闻事件的识别方法中步骤306的流程图，如图9所示，本实施例中，步骤306具体包括以下步骤：

步骤306a，采用依存分析工具获取目标新闻资讯文本中各词语的依存关系。

步骤306b，选取第三预设个数的有依存关系的名词和动词形成名词动词对。

步骤306c，将名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量。

具体地，本实施例中，在事件中事件主体是重要的信息，因此加入这部分信息有助于识别是否为新闻事件，由于事件的参与者是由名词构成的，事件的动作是由动词构成的，所以本实施例中，首先采用依存分析工具获取目标新闻资讯文本中各词语的依存关系，将名词和动词具有直接关系的优先选择，若名词和动词间有依存关系但并不是直接的关系，则顺序选择，选择出第三预设个数的依存关系的名词和动词，将名词和动词拼接在一起作为多个名词动词对，最后将每个名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量，若目标新闻资讯文本中的名词动词对没有达到第三预设个数，则使用零向量进行补充。

本实施例中，将名词动词对中的名词和动词进行词向量化处理的方法与本实施例中的步骤305b1中对每个词语进行词向量化处理的方法相同，在此不再一一赘述。

本实施例中，第三预设个数可以为3个，或2个，或其他适宜的数值，本实施例中对此不作限定。

步骤307，获取目标新闻资讯文本的用户搜索行为特征。

进一步地，本实施例中，用户搜索行为特征为资讯访问量向量。

相应地，图10为本申请实施例二提供的新闻事件的识别方法中步骤307的流程图，如图10所示，本实施例中，步骤307具体包括以下步骤：

步骤307a，计算目标新闻资讯文本与预设范围内新闻资讯文本的相似度。

进一步地，本实施例中，可采用SimHash算法计算目标新闻资讯文本与预设范围内新闻资讯文本的相似度。

步骤307b，获取目标新闻资讯文本和相似度大于预设相似阈值的新闻资讯文本的链接点击次数。

进一步地，本实施例中，相似度大于预设相似阈值的新闻资讯文本为与目标新闻资讯文本相似的新闻资讯文本，获取目标新闻资讯文本和相似的新闻资讯文本的对应的链接总的点击次数作为训练样本的资讯访问量。

其中，预设相似阈值可以为70％，80％，或其他适宜的数值，本实施例中对此不作限定。

步骤307c，将链接点击次数对应的向量确定为资讯访问量。

进一步地，预先存储每个范围的链接点击次数对应的多维向量表示，确定链接点击次数落入的链接点击次数的范围，根据落入的链接点击次数的范围确定目标新闻资讯文本对应的资讯访问向量。

步骤308，根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别。

进一步地，图11为本申请实施例二提供的新闻事件的识别方法中步骤308的流程图，如图11所示，本实施例中，步骤308具体包括以下步骤：

步骤308a，全连接层根据句子上下文特征，事件主体特征及用户搜索行为特征采用softmax分类器对目标新闻资讯文本进行分类。

进一步地，本实施例中，全连接层中具有softmax分类器，softmax分类器根据目标新闻资讯文本的句子上下文特征，事件主体特征及用户搜索行为特征对目标新闻资讯文本是否属于新闻事件进行分类，将分类结果发送给输出层。

步骤308b，输出层输出目标新闻资讯文本是否为新闻事件的分类结果。

输出层接收全连接层输出的分类结果，并输出目标新闻资讯文本是否为新闻事件的分类结果。

本实施例提供的新闻事件的识别方法，通过构建深度学习模型的训练集，训练集中的训练样本包括：事件新闻资讯文本和非事件新闻资讯文本，采用深度学习模型提取训练样本的句子上下文特征，获取训练样本的事件主体特征及用户搜索行为特征，根据训练样本的句子上下文特征，事件主体特征及用户搜索行为特征对深度学习模型进行训练，直到深度学习模型中的参数达到最优参数为止，以获得优化后的深度学习模型，采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征，获取目标新闻资讯文本的事件主体特征，获取目标新闻资讯文本的用户搜索行为特征，根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别，由于在进行目标新闻资讯文本的识别时，获取了是否包含事件关键特征：事件主体特征和句子上下文特征，并且用户搜索行为特征也反映是否包含事件的特征，将这些特征采用优化的卷积神经网络模型进行特征学习和识别，优化的卷积神经网络模型能够将特征学习融入到模型训练中，自动从数据中学习合适的特征，减少了特征学习的时间，提高了识别的效率，并且提高了新闻事件识别的准确率。

本实施例提供的新闻事件的识别方法，采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征时，优化的深度学习模型为优化的卷积神经网络模型，输入层将所述目标新闻资讯文本进行分词处理，以获取所述目标新闻资讯文本的每个词语；所述输入层对每个词语进行向量化处理，获得每个词语的总向量，所述总向量由词向量，位置向量及词性向量拼接而成；所述卷积层对每个词语的总向量进行卷积处理，以提取每个词语的局部特征向量；所述卷积层对每个词语的局部特征向量进行池化处理，以获得每个词语的最优特征值；所述卷积层对所有词语的最优特征值进行非线性变换，获得所述句子上下文向量，句子上下文向量中的词向量，位置向量及词性向量更能反映事件的关键特征，所以使提取的句子上下文向量更能体现事件的关键特征，进而进一步提高识别的准确率。

本实施例提供的新闻事件的识别方法，事件主体特征为名词动词对向量，所述获取所述目标新闻资讯文本的事件主体特征，具体包括：采用依存分析工具获取所述目标新闻资讯文本中各词语的依存关系；选取第三预设个数的有依存关系的名词和动词形成名词动词对；将名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量。用户搜索行为特征为资讯访问量向量，所述获取所述目标新闻资讯文本的用户搜索行为特征，具体包括：计算所述目标新闻资讯文本与预设范围内新闻资讯文本的相似度；获取所述目标新闻资讯文本和相似度大于预设相似阈值的新闻资讯文本的链接点击次数；将所述链接点击次数对应的向量确定为资讯访问量向量。使获取到的事件主体特征和用户搜索行为特征更能反映事件的关键特征，进而进一步提高识别的准确率。

实施例三

图12为本申请实施例三提供的新闻事件的识别装置的结构示意图，如图12所示，本实施例提供的新闻事件的识别装置包括：句子上下文特征提取模块1201，事件主体特征获取模块1202，用户搜索行为特征获取模块1203，新闻事件识别模块1204。

其中，句子上下文特征提取模块1201，用于采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征。事件主体特征获取模块1202，用于获取目标新闻资讯文本的事件主体特征。用户搜索行为特征获取模块1203，用于获取目标新闻资讯文本的用户搜索行为特征。新闻事件识别模块1204，用于根据句子上下文特征，事件主体特征及用户搜索行为特征采用优化的深度学习模型对目标新闻资讯文本进行是否为新闻事件的识别。

本实施例提供的新闻事件的识别装置可以执行图2所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

实施例四

图13为本申请实施例四提供的新闻事件的识别装置的结构示意图，如图13所示，本实施例提供的新闻事件的识别装置在本申请实施例三提供的新闻事件的识别装置的基础上，进一步地，还包括：训练集构建模块1301，深度学习模型训练模块1302。

进一步地，本实施例中，优化的深度学习模型为优化的卷积神经网络模型，优化的卷积神经网络模型包括：输入层和卷积层；句子上下文特征为句子上下文向量。

相应地，句子上下文特征提取模块1201，具体包括：分词处理子模块12011，向量化处理子模块12012，卷积处理子模块12013，池化处理子模块12014及非线性变换子模块12015。

其中，分词处理子模块12011，用于将目标新闻资讯文本进行分词处理，以获取目标新闻资讯文本的每个词语。向量化处理子模块12012，用于对每个词语进行向量化处理，获得每个词语的总向量，总向量由词向量，位置向量及词性向量拼接而成。卷积处理子模块12013，用于对每个词语的总向量进行卷积处理，以提取每个词语的局部特征向量。池化处理子模块12014，用于对每个词语的局部特征向量进行池化处理，以获得每个词语的最优特征值。非线性变换子模块12015，用于对所有词语的最优特征值进行非线性变换，获得句子上下文向量。

进一步地，向量化处理子模块12012具体包括：词向量化处理子模块12012a，位置向量化处理子模块12012b和词性向量化处理子模块12012c。

其中，词向量化处理子模块12012a，用于对每个词语进行词向量化处理，以获得每个词语的词向量。位置向量化处理子模块12012b，用于对每个词语进行位置向量化处理，以获得每个词语的位置向量。词性向量化处理子模块12012c，用于对每个词语进行词性向量化处理，以获得每个词语的词性向量。

优选地，词向量化处理子模块12012a，具体用于：输入层中的词向量模型对每个词语进行词向量识别，输出每个词语的词向量；其中，词向量模型是通过新闻资讯文本中的语料训练获得的。

优选地，位置向量化处理子模块12012b，具体用于：输入层识别目标新闻资讯文本中的第一预设个数的实体和第二预设个数的动词；输入层计算每个词语与实体和动词的相对位置；输入层将相对位置映射到正态分布向量上，形成每个词语的位置向量。

优选地，词性向量化处理子模块12012c，具体用于：输入层确定每个词语的词性；输入层将每个词语的词性映射为对应的词性向量。

进一步地，非线性变换子模块12015，具体用于：卷积层对所有词语的最优特征值进行双曲正切变换，获得句子上下文向量。

进一步地，事件主体特征为名词动词对向量；

相应地，事件主体特征获取模块1202，具体用于：采用依存分析工具获取目标新闻资讯文本中各词语的依存关系；选取第三预设个数的有依存关系的名词和动词形成名词动词对；将名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量。

进一步地，用户搜索行为特征为资讯访问量向量；

相应地，用户搜索行为特征获取模块1203，具体用于：计算目标新闻资讯文本与预设范围内新闻资讯文本的相似度；获取目标新闻资讯文本和相似度大于预设相似阈值的新闻资讯文本的链接点击次数；将链接点击次数对应的向量确定为资讯访问量。

进一步地，优化的卷积神经网络模型还包括：全连接层和输出层；

相应地，新闻事件识别模块1204，具体用于：全连接层根据句子上下文特征，事件主体特征及用户搜索行为特征采用softmax分类器对目标新闻资讯文本进行分类；输出层输出目标新闻资讯文本是否为新闻事件的分类结果。

进一步地，训练集构建模块1301，用于构建深度学习模型的训练集，训练集中的训练样本包括：事件新闻资讯文本和非事件新闻资讯文本。句子上下文特征提取模块1201，还用于采用深度学习模型提取训练样本的句子上下文特征。事件主体特征获取模块1202，还用于获取训练样本的事件主体特征，用户搜索行为特征获取模块1203，还用于获取训练样本的用户搜索行为特征。深度学习模型训练模块1302，用于根据训练样本的句子上下文特征，事件主体特征及用户搜索行为特征对深度学习模型进行训练，直到深度学习模型中的参数达到最优参数为止，以获得优化的深度学习模型。

本实施例提供的新闻事件的识别装置可以执行图3-图11所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

实施例五

图14为本申请实施例五提供的电子设备的结构示意图，如图5所示，本实施例提供的电子设备包括：存储器1401，处理器1402以及计算机程序。

其中，计算机程序存储在存储器1401中，并被配置为由处理器1402执行以实现如本申请实施例一提供的新闻事件的识别方法或本申请实施例二提供的新闻事件的识别方法。

相关说明可以对应参见图2至图11的步骤所对应的相关描述和效果进行理解，此处不做过多赘述。

实施例六

本申请实施例六提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行以实现如本申请实施例一提供的新闻事件的识别方法或本申请实施例二提供的新闻事件的识别方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种新闻事件的识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述优化的深度学习模型为优化的卷积神经网络模型，所述优化的卷积神经网络模型包括：输入层和卷积层；所述句子上下文特征为句子上下文向量；

所述采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征，具体包括：

所述输入层将所述目标新闻资讯文本进行分词处理，以获取所述目标新闻资讯文本的每个词语；

所述输入层对每个词语进行向量化处理，获得每个词语的总向量，所述总向量由词向量，位置向量及词性向量拼接而成；

所述卷积层对每个词语的总向量进行卷积处理，以提取每个词语的局部特征向量；

所述卷积层对每个词语的局部特征向量进行池化处理，以获得每个词语的最优特征值；

所述卷积层对所有词语的最优特征值进行非线性变换，获得所述句子上下文向量。

3.根据权利要求2所述的方法，其特征在于，所述输入层对每个词语进行向量化处理，获得每个词语的总向量，具体包括：

所述输入层对每个词语进行词向量化处理，以获得每个词语的词向量；

所述输入层对每个词语进行位置向量化处理，以获得每个词语的位置向量；

所述输入层对每个词语进行词性向量化处理，以获得每个词语的词性向量。

4.根据权利要求3所述的方法，其特征在于，所述输入层对每个词语进行词向量化处理，以获得每个词语的词向量，具体为：

所述输入层中的词向量模型对每个词语进行词向量识别，输出每个词语的词向量；

其中，所述词向量模型是通过新闻资讯文本中的语料训练获得的。

5.根据权利要求3所述的方法，其特征在于，所述输入层对每个词语进行位置向量化处理，以获得每个词语的位置向量，具体包括：

所述输入层识别所述目标新闻资讯文本中的第一预设个数的实体和第二预设个数的动词；

所述输入层计算每个词语与所述实体和所述动词的相对位置；

所述输入层将所述相对位置映射到正态分布向量上，形成每个词语的位置向量。

6.根据权利要求3所述的方法，其特征在于，所述输入层对每个词语进行词性向量化处理，以获得每个词语的词性向量，具体包括：

所述输入层确定每个词语的词性；

所述输入层将每个词语的词性映射为对应的词性向量。

7.根据权利要求2所述的方法，其特征在于，所述卷积层对所有词语的最优特征值进行非线性变换，获得所述句子上下文向量，具体为：

所述卷积层对所有词语的最优特征值进行双曲正切变换，获得所述句子上下文向量。

8.根据权利要求1所述的方法，其特征在于，所述事件主体特征为名词动词对向量，所述获取所述目标新闻资讯文本的事件主体特征，具体包括：

采用依存分析工具获取所述目标新闻资讯文本中各词语的依存关系；

选取第三预设个数的有依存关系的名词和动词形成名词动词对；

将名词动词对中的名词和动词进行词向量化处理，获得名词动词对向量。

9.根据权利要求1所述的方法，其特征在于，所述用户搜索行为特征为资讯访问量向量，所述获取所述目标新闻资讯文本的用户搜索行为特征，具体包括：

计算所述目标新闻资讯文本与预设范围内新闻资讯文本的相似度；

获取所述目标新闻资讯文本和相似度大于预设相似阈值的新闻资讯文本的链接点击次数；

将所述链接点击次数对应的向量确定为资讯访问量向量。

10.根据权利要求2所述的方法，其特征在于，所述优化的卷积神经网络模型还包括：全连接层和输出层；

所述根据所述句子上下文特征，所述事件主体特征及所述用户搜索行为特征采用所述优化的深度学习模型对所述目标新闻资讯文本进行是否为新闻事件的识别，具体包括：

所述全连接层根据所述句子上下文特征，所述事件主体特征及所述用户搜索行为特征采用softmax分类器对所述目标新闻资讯文本进行分类；

所述输出层输出所述目标新闻资讯文本是否为新闻事件的分类结果。

11.根据权利要求1所述的方法，其特征在于，所述采用优化的深度学习模型提取目标新闻资讯文本的句子上下文特征之前，还包括：

构建所述深度学习模型的训练集，所述训练集中的训练样本包括：事件新闻资讯文本和非事件新闻资讯文本；

采用所述深度学习模型提取训练样本的句子上下文特征；

获取所述训练样本的事件主体特征及用户搜索行为特征；

根据所述训练样本的句子上下文特征，事件主体特征及用户搜索行为特征对所述深度学习模型进行训练，直到所述深度学习模型中的参数达到最优参数为止，以获得优化的深度学习模型。

12.一种新闻事件的识别装置，其特征在于，包括：

13.一种电子设备，其特征在于，包括：存储器，处理器以及计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求1-11中任一项所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行如权利要求1-11中任一项所述的方法。