WO2019041528A1

WO2019041528A1 - 新闻情感方向判断方法、电子设备及计算机可读存储介质

Info

Publication number: WO2019041528A1
Application number: PCT/CN2017/108811
Authority: WO
Inventors: 陈一恋; 汪超慧; 王智; 汪伟; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2017-08-31
Filing date: 2017-10-31
Publication date: 2019-03-07
Also published as: CN107688651B; CN107688651A

Abstract

一种新闻情感方向判断方法，该方法包括步骤：通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数（S31）；根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数（S32）；根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向（S33）。该方法可以提升新闻情感方向判断的准确率。

Description

新闻情感方向判断方法、电子设备及计算机可读存储介质

本专利申请以2017年8月31日提交的申请号为201710775417.9，名称为“新闻情感方向判断方法、电子设备及计算机可读存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及计算机信息技术领域，尤其涉及一种新闻情感方向判断方法、电子设备及计算机可读存储介质。

背景技术

在进行新闻语义解析的同时，往往需要关注新闻的情感方向是正面还是负面，以及正负面的程度如何。现有方法通常采用机器学习方法(比如随机森林等算法)对新闻进行分数计算，根据所得分数判断新闻的正负面，这样的结果可能准确度不高、导致不好的客户体验。故，现有技术中的新闻情感方向判断方法设计不够合理，亟需改进。

发明内容

有鉴于此，本申请提出一种新闻情感方向判断方法、电子设备及计算机可读存储介质，通过预设的事件标签命中规则(包括事件关键字或事件正则表达式)，对机器学习算法获取的新闻情感分数进行调整，有效提升了新闻情感方向判断的准确率。

首先，为实现上述目的，本申请提出一种新闻情感方向判断方法，该方法应用于电子设备，所述方法包括：

通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数；

根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数；及

根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向。

此外，为实现上述目的，本申请还提供一种电子设备，所述电子设备包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的新闻情感方向判断系统，所述新闻情感方向判断系统被所述处理器执行时，所述处理器执行如上所述的新闻情感方向判断方法的步骤。

进一步地，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有新闻情感方向判断系统，所述新闻情感方向判断系统可被至少一个处理器执行，以使所述至少一个处理器执行如上述的新闻情感方向判断方法的步骤。

相较于现有技术，本申请所提出的电子设备、新闻情感方向判断方法及计算机可读存储介质，通过预设的事件标签命中规则(包括事件关键字或事件正则表达式)，对机器学习算法(如随机森林算法)获取的新闻情感分数进行调整，相较于传统的只采用随机森林等机器学习算法的新闻情感方向判断方法而言，本申请评分计算的结果准确度更高，覆盖面更广，客户体验更佳。

附图说明

图1是本申请电子设备一可选的硬件架构的示意图；

图2是本申请电子设备中新闻情感方向判断系统一实施例的程序模块示意图；

图3为本申请新闻情感方向判断方法一实施例的实施流程示意图。

附图标记：

电子设备	2
存储器	21
处理器	22
网络接口	23
新闻情感方向判断系统	20
评分模块	201
调整模块	202
判断模块	203
流程步骤	S31-S33

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

进一步需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

首先，本申请提出一种电子设备2。

参阅图1所示，是本申请电子设备2一可选的硬件架构的示意图。本实施例中，所述电子设备2可包括，但不限于，可通过系统总线相互通信连接存储器21、处理器22、网络接口23。需要指出的是，图1仅示出了具有组件21-23的电子设备2，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，所述电子设备2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备，该电子设备2可以是独立的服务器，也可以是多个服务器所组成的服务器集群。

所述存储器21至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器21可以是所述电子设备2的内部存储单元，例如该电子设备2的硬盘或内存。在另一些实施例中，所述存储器21也可以是所述电子设备2的外部存储设备，例如该电子设备2上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器21还可以既包括所述电子设备2的内部存储单元也包括其外部存储设备。本实施例中，所述存储器21通常用于存储安装于所述电子设备2的操作系统和各类应用软件，例如所述新闻情感方向判断系统20的程序代码等。此外，所述存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器22在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器22通常用于控制所述电子设备2的总体操作，例如执行与所述电子设备2 进行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器22用于运行所述存储器21中存储的程序代码或者处理数据，例如运行所述的新闻情感方向判断系统20等。

所述网络接口23可包括无线网络接口或有线网络接口，该网络接口23通常用于在所述电子设备2与其他电子设备之间建立通信连接。例如，所述网络接口23用于通过网络将所述电子设备2与外部数据平台相连，在所述电子设备2与外部数据平台之间的建立数据传输通道和通信连接。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

至此，己经详细介绍了本申请各个实施例的应用环境和相关设备的硬件结构和功能。下面，将基于上述应用环境和相关设备，提出本申请的各个实施例。

参阅图2所示，是本申请电子设备2中新闻情感方向判断系统20一实施例的程序模块图。本实施例中，所述的新闻情感方向判断系统20可以被分割成一个或多个程序模块，所述一个或者多个程序模块被存储于所述存储器21中，并由一个或多个处理器(本实施例中为所述处理器22)所执行，以完成本申请。例如，在图2中，所述的新闻情感方向判断系统20可以被分割成评分模块201、调整模块202、以及判断模块203。本申请所称的程序模块是指能够完成特定功能的一系列计算机程序指令段，比程序更适合于描述所述新闻情感方向判断系统20在所述电子设备2中的执行过程。以下将就各程序模块201-203的功能进行详细描述。

所述评分模块201，用于通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数。

优选地，在本实施例中，所述预定的机器学习算法可以采用随机森林算法(如开源包weka)，其语义评分包括如下步骤：

(1)先人工选择随机森林模型训练集，其中，正面、负面新闻数据内容为每篇新闻的标题；

(2)获取训练集(训练模型)所需中文词向量库(向量库语料可以是开源的维基新闻内容)，通过对训练集中的训练样本进行HanLP分词，并用词向量代替分词，对每条训练集数据进行标准化处理；

(3)通过bagging算法选取训练集元组，并经过Radomtree算法训练随机森林模型中的每棵决策树，重复M次，得到M个基分类器；

(4)预测：对于待预测新闻的标题进行向量转换，用上述训练好的基分类器进行预测投票，预测数量最多的类别作为该新闻的类别(如正面类别和负面类别)，将预测的指定类别(如类别1)的数量除以决策树的总数量，即为判断的该指定类别(如类别1)的概率p，其中，概率p的取值范围为[0，1]，用公式p＝2*p-1换算成取值范围为[-1，1]，换算后的数值作为该待预测新闻的情感分数。

举例而言，假设待预测新闻A，经过训练模型(假设训练模型有1000棵决策树)预测。

若其中520棵树预测为类别0(代表负面类别)，480棵树预测为类别1(代表正面类别)，则此种情形下该待预测新闻A的类别是0，对应的情感分数为score＝2*(480/1000)-1＝-0.04；

若其中520棵树预测为类别1，480棵树预测为类别0，则此种情形下该待预测新闻A的类别是1，对应的情感分数为score＝2*(520/1000)-1＝0.04。

所述调整模块202，用于根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数。其中，所述事件标签-事件关键词规则可以设置为第一文件(如第一动态词典)，即将所述事件标签-事件关键词规则的具体内容用文件的形式(本实施例为第一文件)进行记录。在本实施例中，该第一文件可以包括如下内容：事件标签(用于区分事件的类别，如发展调整等)、事件关键词(如转型、升级等)、及每个事件关键词对应的情感分数(评分)。

举例而言，所述第一文件可以设置为如下文件A的格式：

在上述文件A中，若从新闻标题中识别到第一行任意一个事件关键词(如“转型”)，则该篇新闻的主要经营事件为对应的事件标签(“发展调整”)，该篇新闻的情感分数为0.2。

优选地，在本实施例中，可以将事件关键词对应的评分范围设置为[-1，1]。进一步地，可以将该评分范围继续分成若干档的子区间，例如，分成如下四档的子区间：[-1,-0.75)，[-0.75,-0.5)，[-0.5,-0.04)，[-0.04,1]，其中，子区间[-1,-0.75)和[-0.75,-0.5)代表重大负面新闻，[-0.5,-0.04)代表一般负面新闻，[-0.04,1]代表正面新闻。同理，所述预定的机器学习算法(如随机森林算法)获取的情感分数范围[-1，1]也可以分成上述四档的子区间。

具体而言，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数包括如下步骤：

遍历该待预测新闻的标题和正文；

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，则将该识别出的事件关键词在所述第一文件中对应的情感分数作为该待预测新闻的最终评分，并将该识别出的事件关键词对应的事件标签作为该待预测新闻的主要经营事件；

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。

优选地，在其它实施例中，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括如下步骤：

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，且该识别出的事件关键词在所述第一文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内(即同一分档对应的子区间内，如[-0.04,1])，则以该识别出的事件关键词在所述第一文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。

具体而言，所述加权计算包括：将该识别出的事件关键词在所述第一文件中对应的情感分数乘以第一预设比例(如60％)，将所述预定的机器学习算法获取的情感分数乘以第二预设比例(如40％)，然后将两者的乘积相加得到一个加权分数作为该待预测新闻的最终评分。其中，所述第一预设比例大于第二预设比例，且所述第一预设比例与第二预设比例之和为1。

举例而言，若该识别出的事件关键词在所述第一文件中对应的情感分数为0.2(位于分档子区间[-0.04,1])，而所述预定的机器学习算法获取的情感分数为-0.2(位于分档子区间[-0.5,-0.04))，两者显然不在同一分档内，则本申请以0.2评分为主要权重去调整评分。

优选地，在其它实施例中，所述调整模块202还用于：

根据预设的事件标签-事件正则表达式规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数。其中，所述事件标签-事件正则表达式规则可以设置为第二文件(如第二动态词典)，即将所述事件标签-事件正则表达式规则的具体内容用文件的形式(本实施例为第二文件)进行记录。在本实施例中，该第二文件可以包括如下内容：事件标签(用于区分事件的类别，如业绩预增等)、事件正则表达式(根据不同业务经验和相关逻辑进行设定，如下文件B所示)、及每个事件正则表达式对应的情感分数(评分)。

举例而言，所述第二文件可以设置为如下文件B的格式：

在上述文件B中，若从新闻标题中识别出与第一行事件正则表达式符合的内容，则该篇新闻的主要经营事件为对应的事件标签(如“业绩预增”)，该篇新闻的情感分数为0.4。

优选地，可以将事件正则表达式对应的评分范围设置为[-1，1]。进一步地，可以将该评分范围继续分成若干档的子区间，例如，分成如下四档的子区间：[-1,-0.75)，[-0.75,-0.5)，[-0.5,-0.04)，[-0.04,1]，其中，子区间[-1,-0.75)和[-0.75,-0.5)代表重大负面新闻，[-0.5,-0.04)代表一般负面新闻，[-0.04,1]代表正面新闻。

进一步地，此种情形下，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括如下步骤：

若从该待预测新闻的标题和正文中识别出与所述第二文件中的事件正则表达式符合的内容，则将该事件正则表达式在所述第二文件中对应的情感分数作为该待预测新闻的最终评分，并将该事件正则表达式对应的事件标签作为该待预测新闻的主要经营事件。

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，且没有识别出与所述第二文件中的事件正则表达式符合的内容，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。

若从该待预测新闻的标题和正文中识别出与所述第二文件中的事件正则表达式符合的内容，且该事件正则表达式在所述第二文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内(即同一分档对应的子区间内，如[-0.04,1])，则以该事件正则表达式在所述第二文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。

具体而言，所述加权计算包括：将该事件正则表达式在所述第二文件中对应的情感分数乘以第一预设比例(如60％)，将所述预定的机器学习算法获取的情感分数乘以第二预设比例(如40％)，然后将两者的乘积相加得到一个加权分数作为该待预测新闻的最终评分。其中，所述第一预设比例大于第二预设比例，且所述第一预设比例与第二预设比例之和为1。

举例而言，若该事件正则表达式在所述第二文件中对应的情感分数为0.4(位于分档子区间[-0.04,1])，而所述预定的机器学习算法获取的情感分数为-0.4(位于分档子区间[-0.5,-0.04))，两者显然不在同一分档内，则本申请以 0.4评分为主要权重去调整评分。

所述判断模块203，用于根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向。具体而言，若调整得到的该待预测新闻的情感分数位于第一评分区间(如[-1，-0.04))，则确定该待预测新闻的情感方向为负面；若调整得到的该待预测新闻的情感分数位于第二评分区间(如[-0.04，1])，则确定该待预测新闻的情感方向为正面。

需要说明的是，在其它实施例中，还可以进一步对上述第一评分区间或第二评分区间进行细分。例如，可以将所述第一评分区间[-1，-0.04)进一步划分成子区间[-1，-0.5)和[-0.5，-0.04)，其中，子区间[-1，-0.5)代表重大负面新闻，子区间[-0.5，-0.04)代表一般负面新闻。

通过上述程序模块201-203，本申请所提出的新闻情感方向判断系统20，通过预设的事件标签命中规则(包括事件关键字或事件正则表达式)，对机器学习算法(如随机森林算法)获取的新闻情感分数进行调整，相较于传统的只采用随机森林等机器学习算法的新闻情感方向判断方法而言，本申请评分计算的结果准确度更高，覆盖面更广，客户体验更佳。

此外，本申请还提出一种新闻情感方向判断方法。

参阅图3所示，是本申请新闻情感方向判断方法一实施例的实施流程示意图。在本实施例中，根据不同的需求，图3所示的流程图中的步骤的执行顺序可以改变，某些步骤可以省略。

步骤S31，通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数。

步骤S32，根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数。其中，所述事件标签-事件关键词规则可以设置为第一文件(如第一动态词典)，即将所述事件标签-事件关键词规则的具体内容用文件的形式(本实施例为第一文件)进行记录。在本实施例中，该第一文件可以包括如下内容：事件标签(用于区分事件的类别，如发展调整等)、事件关键词(如转型、升级等)、及每个事件关键词对应的情感分数(评分)。

举例而言，所述第一文件可以设置为如下表格文件A的格式：

遍历该待预测新闻的标题和正文；

优选地，在其它实施例中，步骤S32还包括如下步骤：

举例而言，所述第二文件可以设置为如下表格文件B的格式：

举例而言，若该事件正则表达式在所述第二文件中对应的情感分数为0.4(位于分档子区间[-0.04,1])，而所述预定的机器学习算法获取的情感分数为-0.4(位于分档子区间[-0.5,-0.04))，两者显然不在同一分档内，则本申请以0.4评分为主要权重去调整评分。

步骤S33，根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向。具体而言，若调整得到的该待预测新闻的情感分数位于第一评分区间(如[-1，-0.04))，则确定该待预测新闻的情感方向为负面；若调整得到的该待预测新闻的情感分数位于第二评分区间(如[-0.04，1])，则确定该待预测新闻的情感方向为正面。

通过上述步骤S31-S33，本申请所提出的新闻情感方向判断方法，通过预设的事件标签命中规则(包括事件关键字或事件正则表达式)，对机器学习算法(如随机森林算法)获取的新闻情感分数进行调整，相较于传统的只采用随机森林等机器学习算法的新闻情感方向判断方法而言，本申请评分计算的结果准确度更高，覆盖面更广，客户体验更佳。

进一步地，为实现上述目的，本申请还提供一种计算机可读存储介质(如ROM/RAM、磁碟、光盘)，所述计算机可读存储介质存储有新闻情感方向判断系统20，所述新闻情感方向判断系统20可被至少一个处理器22执行，以使所述至少一个处理器22执行如上所述的新闻情感方向判断方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件来实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上参照附图说明了本申请的优选实施例，并非因此局限本申请的权利范围。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。另外，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本领域技术人员不脱离本申请的范围和实质，可以有多种变型方案实现本申请，比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种新闻情感方向判断方法，应用于电子设备，其特征在于，所述方法包括：

通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数；

根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数；及

根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向。
如权利要求1所述的新闻情感方向判断方法，其特征在于，所述事件标签-事件关键词规则设置为第一文件，该第一文件包括用于区分事件类别的事件标签、事件关键词、及每个事件关键词对应的情感分数。
如权利要求2所述的新闻情感方向判断方法，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数包括：

遍历该待预测新闻的标题和正文；

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，则将该识别出的事件关键词在所述第一文件中对应的情感分数作为该待预测新闻的最终评分，并将该识别出的事件关键词对应的事件标签作为该待预测新闻的主要经营事件；及

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。
如权利要求3所述的新闻情感方向判断方法，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括：

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，且该识别出的事件关键词在所述第一文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内，则以该识别出的事件关键词在所述第一文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。
如权利要求4所述的新闻情感方向判断方法，其特征在于，所述加权计算包括：

将该识别出的事件关键词在所述第一文件中对应的情感分数乘以第一预设比例，将所述预定的机器学习算法获取的情感分数乘以第二预设比例；及

将两者的乘积相加得到一个加权分数作为该待预测新闻的最终评分，其中，所述第一预设比例大于第二预设比例，且所述第一预设比例与第二预设比例之和为1。
如权利要求1或2所述的新闻情感方向判断方法，其特征在于，该方法还包括：

根据预设的事件标签-事件正则表达式规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数，其中，所述事件标签-事件正则表达式规则设置为第二文件，该第二文件包括用于区分事件类别的事件标签、事件正则表达式、及每个事件正则表达式对应的情感分数。
如权利要求6所述的新闻情感方向判断方法，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数包括：

若从该待预测新闻的标题和正文中识别出与所述第二文件中的事件正则表达式符合的内容，则将该事件正则表达式在所述第二文件中对应的情感分数作为该待预测新闻的最终评分，并将该事件正则表达式对应的事件标签作为该待预测新闻的主要经营事件；及

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，且没有识别出与所述第二文件中的事件正则表达式符合的内容，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。
如权利要求7所述的新闻情感方向判断方法，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括：

若从该待预测新闻的标题和正文中识别出与所述第二文件中的事件正则表达式符合的内容，且该事件正则表达式在所述第二文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内，则以该事件正则表达式在所述第二文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。
一种电子设备，其特征在于，所述电子设备包括存储器、处理器，所述存储器上存储有可在所述处理器上运行的新闻情感方向判断系统，所述新闻情感方向判断系统被所述处理器执行时，所述处理器执行如下步骤：

通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数；

根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数；及

根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向。
如权利要求9所述的电子设备，其特征在于，所述事件标签-事件关键词规则设置为第一文件，该第一文件包括用于区分事件类别的事件标签、事件关键词、及每个事件关键词对应的情感分数。
如权利要求10所述的电子设备，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数包括：

遍历该待预测新闻的标题和正文；

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，则将该识别出的事件关键词在所述第一文件中对应的情感分数作为该待预测新闻的最终评分，并将该识别出的事件关键词对应的事件标签作为该待预测新闻的主要经营事件；及

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。
如权利要求11所述的电子设备，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括：

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，且该识别出的事件关键词在所述第一文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内，则以该识别出的事件关键词在所述第一文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。
如权利要求12所述的电子设备，其特征在于，所述加权计算包括：

将该识别出的事件关键词在所述第一文件中对应的情感分数乘以第一预设比例，将所述预定的机器学习算法获取的情感分数乘以第二预设比例；及

将两者的乘积相加得到一个加权分数作为该待预测新闻的最终评分，其中，所述第一预设比例大于第二预设比例，且所述第一预设比例与第二预设比例之和为1。
如权利要求9或10所述的电子设备，其特征在于，所述新闻情感方向判断系统被所述处理器执行时，所述处理器还执行如下步骤：

根据预设的事件标签-事件正则表达式规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数，其中，所述事件标签-事件正则表达式规则设置为第二文件，该第二文件包括用于区分事件类别的事件标签、事件正则表达式、及每个事件正则表达式对应的情感分数。
如权利要求14所述的电子设备，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数包括：

若从该待预测新闻的标题和正文中识别出与所述第二文件中的事件正则表达式符合的内容，则将该事件正则表达式在所述第二文件中对应的情感分数作为该待预测新闻的最终评分，并将该事件正则表达式对应的事件标签作为该待预测新闻的主要经营事件；及

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，且没有识别出与所述第二文件中的事件正则表达式符合的内容，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。
如权利要求15所述的电子设备，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括：

若从该待预测新闻的标题和正文中识别出与所述第二文件中的事件正则表达式符合的内容，且该事件正则表达式在所述第二文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内，则以该事件正则表达式在所述第二文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。
一种计算机可读存储介质，所述计算机可读存储介质存储有新闻情感方向判断系统，所述新闻情感方向判断系统可被至少一个处理器执行，以使所述至少一个处理器执行如下步骤：

通过预定的机器学习算法，针对待预测新闻进行语义评分，获取该待预测新闻的情感分数；

根据预设的事件标签-事件关键词规则，调整所述预定的机器学习算法获取的该待预测新闻的情感分数；及

根据调整得到的该待预测新闻的情感分数，确定该待预测新闻的情感方向。
如权利要求17所述的计算机可读存储介质，其特征在于，所述事件标签-事件关键词规则设置为第一文件，该第一文件包括用于区分事件类别的事件标签、事件关键词、及每个事件关键词对应的情感分数。
如权利要求18所述的计算机可读存储介质，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数包括：

遍历该待预测新闻的标题和正文；

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，则将该识别出的事件关键词在所述第一文件中对应的情感分数作为该待预测新闻的最终评分，并将该识别出的事件关键词对应的事件标签作为该待预测新闻的主要经营事件；及

若从该待预测新闻的标题和正文中没有识别出所述第一文件中的事件关键词，则将所述预定的机器学习算法获取的该待预测新闻的情感分数作为该待预测新闻的最终评分。
如权利要求19所述的计算机可读存储介质，其特征在于，所述调整所述预定的机器学习算法获取的该待预测新闻的情感分数还包括：

若从该待预测新闻的标题和正文中识别出所述第一文件中的事件关键词，且该识别出的事件关键词在所述第一文件中对应的情感分数与所述预定的机器学习算法获取的情感分数不在同一分档内，则以该识别出的事件关键词在所述第一文件中对应的情感分数为主要权重，与所述预定的机器学习算法获取的情感分数进行加权计算，得到一个加权分数作为该待预测新闻的最终评分。