CN109145151B - 一种视频的情感分类获取方法及装置 - Google Patents

一种视频的情感分类获取方法及装置 Download PDF

Info

Publication number
CN109145151B
CN109145151B CN201810635586.7A CN201810635586A CN109145151B CN 109145151 B CN109145151 B CN 109145151B CN 201810635586 A CN201810635586 A CN 201810635586A CN 109145151 B CN109145151 B CN 109145151B
Authority
CN
China
Prior art keywords
training
emotion classification
vocabulary
comment information
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810635586.7A
Other languages
English (en)
Other versions
CN109145151A (zh
Inventor
李岩
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201810635586.7A priority Critical patent/CN109145151B/zh
Publication of CN109145151A publication Critical patent/CN109145151A/zh
Application granted granted Critical
Publication of CN109145151B publication Critical patent/CN109145151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本发明实施例提供了一种视频的情感分类获取方法及装置。在本发明实施例中,获取用于评论视频的评论信息;确定该评论信息包括的词汇;将该词汇输入预设情感分类模型,得到预设情感分类模型输出的情感分类,并作为该视频的情感分类。通过本发明实施例的方法可以根据视频的评论信息来获取视频的情感分类。

Description

一种视频的情感分类获取方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种视频的情感分类获取方法及装置。
背景技术
随着多媒体技术的高速发展,各种各样的视频在网络上不断涌现。然而,有些视频并不适合未成年人观看,例如带有暴力和色情内容的视频。为了未成年人的健康成长,建立一个良好的网络环境是非常必要的。获取视频的情感分类是建立一个良好的网络环境的基础。
然而,如何获取视频的情感分类是一个亟待解决的技术问题。
发明内容
为了得到视频的情感分类,本发明实施例示出了一种视频的情感分类获取方法及装置。
第一方面,本发明实施例示出了一种视频的情感分类获取方法,所述方法包括:
获取用于评论视频的评论信息;
确定所述评论信息包括的词汇;
将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类。
在一个可选的实现方式中,所述预设情感分类模型,通过如下方式得到:
获取训练评论信息以及获取所述训练评论信息的标注评论情感分类
获取所述训练评论信息包括的训练词汇;
获取每一个训练词汇所属的情感分类;
使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型。
在一个可选的实现方式中,所述获取所述训练评论信息包括的训练词汇,包括:
使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
在一个可选的实现方式中,所述获取每一个训练词汇所属的情感分类,包括:
对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
在一个可选的实现方式中,所述使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型,包括:
使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型。
第二方面,本发明实施例示出了一种视频的情感分类获取装置,所述装置包括:
第一获取模块,用于获取用于评论视频的评论信息;
第一确定模块,用于确定所述评论信息包括的词汇;
第二确定模块,用于将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类。
在一个可选的实现方式中,所述装置还包括:
第二获取模块,用于获取训练评论信息以及获取所述训练评论信息的标注评论情感分类
第三获取模块,用于获取所述训练评论信息包括的训练词汇;
第四获取模块,用于获取每一个训练词汇所属的情感分类;
训练模块,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型。
在一个可选的实现方式中,所述第三获取模块具体用于:使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
在一个可选的实现方式中,所述第四获取模块包括:
查找单元,用于对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
确定单元,用于将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
在一个可选的实现方式中,所述训练模块包括:
第一训练单元,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
第二训练单元,用于在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型。
第三方面,本发明实施例示出了一种终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频的情感分类获取程序,所述视频的情感分类获取程序被所述处理器执行时实现如第一方面所述的视频的情感分类获取方法的步骤。
第四方面,本发明实施例示出了一种计算机可读存储介质,所述计算机可读存储介质上存储有视频的情感分类获取程序,所述视频的情感分类获取程序被处理器执行时实现如第一方面所述的视频的情感分类获取方法的步骤。
与现有技术相比,本发明实施例包括以下优点:
在本发明实施例中,获取用于评论视频的评论信息;确定该评论信息包括的词汇;将该词汇输入预设情感分类模型,得到预设情感分类模型输出的情感分类,并作为该视频的情感分类。通过本发明实施例的方法可以根据视频的评论信息来获取视频的情感分类。
附图说明
图1是本发明的一种视频的情感分类获取方法实施例的步骤流程图;
图2是本发明的一种视频的情感分类获取装置实施例的结构框图;
图3是本发明的一种终端实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种视频的情感分类获取方法实施例的步骤流程图,具体可以包括如下步骤:
在步骤S101中,获取用于评论视频的评论信息;
对于一个视频而言,不同的用户都可以观看该视频,且在观看该视频之后可以向终端提交用于评论视频的评论信息,评论信息可以为一句话或者一个词汇等。
对于终端而言,当接收到用户提交的用于评论该视频的评论信息时,可以将该视频的视频标识与用户提交的该视频的评论信息组成对应表项,并存储在已存储的视频标识与评论信息之间的对应关系中。
因此,当需要获取用于评论该视频的评论信息时,可以在已存储的视频标识与评论信息之间的对应关系中查找与该视频的视频标识相对应的评论信息,并作为用于评论该视频的评论信息。
在步骤S102中,确定该评论信息包括的词汇;
在本发明实施例中,评论信息可以为一句话或者一个词汇等,一句话中包括多个词汇。其中,可以使用汉语分词系统NLPIR对该评论信息分词,得到该评论信息包括的词汇。
在步骤S103中,将该词汇输入预设情感分类模型,得到预设情感分类模型输出的情感分类,并作为该视频的情感分类。
在本发明实施例中,预设情感分类模型,通过如下方式得到:
11)、获取训练评论信息以及获取该训练评论信息的标注评论情感分类;
在本发明实施例中,事先需要获取大量的训练评论信息以及训练评论信息的标注评论情感分类来训练预设情感分类模型。
技术人员事先可以采集训练评论信息,训练评论信息可以为多个。
对于采集的任意一个训练评论信息,技术人员可以观看该训练评论信息的内容,再根据该训练评论信息的内容总结该训练评论信息的评论情感分类,并将其作为该训练评论信息的标注评论情感分类,然后存储该训练评论信息以及存储该训练评论信息的标注评论情感分类。因此,在本步骤中,可以直接获取已存储的该训练评论信息以及获取已存储的该训练评论信息的标注评论情感分类。
对于采集的其他每一个训练评论信息,同样如此。
由于采集的训练评论信息为多个,不同的训练评论信息的标注评论情感分类往往不全相同,因此,为了避免将不同的训练评论信息的标注评论情感分类混淆,在本发明实施例中,在存储该训练评论信息以及存储该训练评论信息的标注评论情感分类时,可以将该训练评论信息与该训练评论信息的标注评论情感分类组成对应表项,并存储在已存储的训练评论信息与标注评论情感分类之间的对应关系中。
因此,在本步骤中,可以获取已存储的训练评论信息与标注评论情感分类之间的对应关系中的每一个训练评论信息,然后对于获取到的任意一个训练评论信息,在已存储的训练评论信息与标注评论情感分类之间的对应关系中查找与该训练评论信息相对应的标注评论情感分类,并作为该训练评论信息相的标注评论情感分类。
12)、获取该训练评论信息包括的训练词汇;
在本发明实施例中,可以使用汉语分词系统NLPIR对该训练评论信息分词,得到该训练评论信息包括的训练词汇,可能得到一个训练词汇,可能得到多个训练词汇。
其中,如果训练评论信息中包括多个连续的数字,则将每一个数字均拆分为一个词汇。
在本发明一个实施例中,有时候训练评论信息中可能包括多个相同的词汇,在对该训练评论信息分词之后,可以仅保留多个相同的词汇中的部分词汇。
例如,评论信息为“66666666”,该评论信息用于表达用户对视频的内容感到很震惊,可以将该评论信息拆分为8个词汇“6”,然后可以仅保留一个训练词汇“6”。
13)、获取每一个训练词汇所属的情感分类;
在本发明实施例中,技术人员事先会设置多个不同的预设情感分类,对于任意一个预设情感分类,可以统计属于该预设情感分类的词汇,并组成该预设情感分类对应的词汇集合。对于其他每一个预设情感分类,同样如此。
其中,一个词汇可能位于一个词汇集合中,也可能同时位于多个不同的词汇集合中,也即,一个词汇可能表达出一种情感分类,也可能同时表达出多种情感分类。
因此,对于获取到的任意一个训练词汇,可以在多个不同的预设情感分类分别对应的词汇集合中,查找包括该训练词汇的词汇集合,并将该词汇集合对应的预设情感分类作为该训练词汇属于的情感分类。对于其他每一训练词汇,同样如此。
14)、使用该情感分类、该训练词汇和该标注评论情感分类对预设分类器进行训练,得到预设情感分类模型。
在本发明一个实施例中,可以使用该情感分类、该训练词汇和该标注评论情感分类对预设分类器进行训练后就可以得到预设情感分类模型;然而,在该训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,则可能使得之后使用预设情感分类模型来获取其他视频的情感分类时,预设情感分类模型输出的情感分类往往是第一情感分类,很少输出第二情感分类,导致预设情感分类模型的精度较低。
因此,为了提高预设情感分类模型的精度,可以使用该情感分类、该训练词汇和该标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;在该训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,再使用第二情感分类、属于第二情感分类的训练词汇以及该标注评论情感分类对参考情感分类模型进行至少一轮训练,得到预设情感分类模型。
在本发明实施例中,获取用于评论视频的评论信息;确定该评论信息包括的词汇;将该词汇输入预设情感分类模型,得到预设情感分类模型输出的情感分类,并作为该视频的情感分类。通过本发明实施例的方法可以根据视频的评论信息来获取视频的情感分类。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图2,示出了本发明一种视频的情感分类获取装置实施例的结构框图,该装置具体可以包括如下模块:
第一获取模块11,用于获取用于评论视频的评论信息;
第一确定模块12,用于确定所述评论信息包括的词汇;
第二确定模块13,用于将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类。
在一个可选的实现方式中,所述装置还包括:
第二获取模块,用于获取训练评论信息以及获取所述训练评论信息的标注评论情感分类
第三获取模块,用于获取所述训练评论信息包括的训练词汇;
第四获取模块,用于获取每一个训练词汇所属的情感分类;
训练模块,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型。
在一个可选的实现方式中,所述第三获取模块具体用于:使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
在一个可选的实现方式中,所述第四获取模块包括:
查找单元,用于对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
确定单元,用于将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
在一个可选的实现方式中,所述训练模块包括:
第一训练单元,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
第二训练单元,用于在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型。
在本发明实施例中,获取用于评论视频的评论信息;确定该评论信息包括的词汇;将该词汇输入预设情感分类模型,得到预设情感分类模型输出的情感分类,并作为该视频的情感分类。通过本发明实施例的方法可以根据视频的评论信息来获取视频的情感分类。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明还示出了一种终端,该终端可以包括:存储器、处理器及存储在存储器上并可在处理器上运行的视频的情感分类获取程序,视频的情感分类获取程序被处理器执行时实现本发明中所述的任意一种视频的情感分类获取方法的步骤。
图3是根据一示例性实施例示出的一种终端600的框图。例如,终端600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图3,终端600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件608,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制装置600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件602可以包括一个或多个处理器620来执行指令,以完成上述视频的情感分类获取方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方便多媒体组件608和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在终端600的操作。这些数据的示例包括用于在终端600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件606为终端600的各种组件提供电力。电源组件606可以包括电源管理系统,一个或多个电源,及其他与为终端600生成、管理和分配电力相关联的组件。
多媒体组件608包括在所述终端600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件608包括一个前置摄像头和/或后置摄像头。当终端600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当终端600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为终端600提供各个方面的状态评估。例如,传感器组件614可以检测到终端600的打开/关闭状态,组件的相对定位,例如所述组件为终端600的显示器和小键盘,传感器组件614还可以检测终端600或终端600一个组件的位置改变,用户与终端600接触的存在或不存在,装置600方位或加速/减速和终端600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于终端600和其他设备之间有线或无线方式的通信。终端600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,终端600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行视频的情感分类获取方法,具体地,该方法包括:
获取用于评论视频的评论信息;
确定所述评论信息包括的词汇;
将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类。
在一个可选的实现方式中,所述预设情感分类模型,通过如下方式得到:
获取训练评论信息以及获取所述训练评论信息的标注评论情感分类
获取所述训练评论信息包括的训练词汇;
获取每一个训练词汇所属的情感分类;
使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型。
在一个可选的实现方式中,所述获取所述训练评论信息包括的训练词汇,包括:
使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
在一个可选的实现方式中,所述获取每一个训练词汇所属的情感分类,包括:
对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
在一个可选的实现方式中,所述使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型,包括:
使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由终端600的处理器620执行以完成上述视频的情感分类获取方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。当存储介质中的指令由终端的处理器执行时,使得终端能够执行本发明中所述的任意一种视频的情感分类获取方法的步骤。
在此提供的视频的情感分类获取方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的视频的情感分类获取方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
A1、一种视频的情感分类获取装置,所述装置包括:
第一获取模块,用于获取用于评论视频的评论信息;
第一确定模块,用于确定所述评论信息包括的词汇;
第二确定模块,用于将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类。
A2、根据A1所述的装置,所述装置还包括:
第二获取模块,用于获取训练评论信息以及获取所述训练评论信息的标注评论情感分类
第三获取模块,用于获取所述训练评论信息包括的训练词汇;
第四获取模块,用于获取每一个训练词汇所属的情感分类;
训练模块,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型。
A3、根据A2所述的装置,所述第三获取模块具体用于:使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
A4、根据A2所述的装置,所述第四获取模块包括:
查找单元,用于对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
确定单元,用于将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
A5、根据A2所述的装置,所述训练模块包括:
第一训练单元,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
第二训练单元,用于在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型。

Claims (8)

1.一种视频的情感分类获取方法,其特征在于,所述方法包括:
获取用于评论视频的评论信息;
确定所述评论信息包括的词汇;
将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类;
其中,所述预设情感分类模型,包括:
获取训练评论信息以及获取所述训练评论信息的标注评论情感分类;
获取所述训练评论信息包括的训练词汇;
获取每一个训练词汇所属的情感分类;
使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型;
其中,所述使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型,包括:
使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型;
其中,所述获取用于评论视频的评论信息,包括:
通过在已存储的视频标识与评论信息之间的对应关系中查找与所述视频的视频标识对应的所述评论信息,获取用于评论所述视频的所述评论信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述训练评论信息包括的训练词汇,包括:
使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
3.根据权利要求1所述的方法,其特征在于,所述获取每一个训练词汇所属的情感分类,包括:
对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
4.一种视频的情感分类获取装置,其特征在于,所述装置包括:
第一获取模块,用于获取用于评论视频的评论信息;
第一确定模块,用于确定所述评论信息包括的词汇;
第二确定模块,用于将所述词汇输入预设情感分类模型,得到所述预设情感分类模型输出的情感分类,并作为所述视频的情感分类;
第二获取模块,用于获取训练评论信息以及获取所述训练评论信息的标注评论情感分类;
第三获取模块,用于获取所述训练评论信息包括的训练词汇;
第四获取模块,用于获取每一个训练词汇所属的情感分类;
训练模块,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行训练,得到所述预设情感分类模型;
其中,所述训练模块包括:
第一训练单元,用于使用所述情感分类、所述训练词汇和所述标注评论情感分类对预设分类器进行一轮训练,得到参考情感分类模型;
第二训练单元,用于在所述训练评论信息包括的多个训练词汇中,如果属于第一情感分类的训练词汇的数量与属于第二情感分类的训练词汇的数量之间的差值大于预设阈值,使用所述第二情感分类、属于所述第二情感分类的训练词汇以及所述标注评论情感分类对所述参考情感分类模型进行至少一轮训练,得到所述预设情感分类模型;
第一获取模块,还用于通过在已存储的视频标识与评论信息之间的对应关系中查找与所述视频的视频标识对应的所述评论信息,获取用于评论所述视频的所述评论信息。
5.根据权利要求4所述的装置,其特征在于,所述第三获取模块具体用于:使用汉语分词系统NLPIR对所述训练评论信息分词,得到所述训练评论信息包括的训练词汇。
6.根据权利要求4所述的装置,其特征在于,所述第四获取模块包括:
查找单元,用于对于每一个训练词汇,在多个不同的预设情感分类分别对应的词汇集合中,查找包括所述训练词汇的词汇集合,每一个预设情感分类对应的词汇集合中存储了属于所述预设情感分类的词汇;
确定单元,用于将包括所述训练词汇的词汇集合所对应的预设情感分类确定为所述训练词汇属于的情感分类。
7.一种终端,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的视频的情感分类获取程序,所述视频的情感分类获取程序被所述处理器执行时实现如权利要求1至3中任一项所述的视频的情感分类获取方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频的情感分类获取程序,所述视频的情感分类获取程序被处理器执行时实现如权利要求1至3中任一项所述的视频的情感分类获取方法的步骤。
CN201810635586.7A 2018-06-20 2018-06-20 一种视频的情感分类获取方法及装置 Active CN109145151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810635586.7A CN109145151B (zh) 2018-06-20 2018-06-20 一种视频的情感分类获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810635586.7A CN109145151B (zh) 2018-06-20 2018-06-20 一种视频的情感分类获取方法及装置

Publications (2)

Publication Number Publication Date
CN109145151A CN109145151A (zh) 2019-01-04
CN109145151B true CN109145151B (zh) 2021-05-18

Family

ID=64802140

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810635586.7A Active CN109145151B (zh) 2018-06-20 2018-06-20 一种视频的情感分类获取方法及装置

Country Status (1)

Country Link
CN (1) CN109145151B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110769267B (zh) * 2019-10-30 2022-02-08 北京达佳互联信息技术有限公司 一种视频的展示方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324939A (zh) * 2013-03-15 2013-09-25 江南大学 基于最小二乘支持向量机技术的偏向性分类及参数寻优方法
CN103996130A (zh) * 2014-04-29 2014-08-20 北京京东尚科信息技术有限公司 一种商品评价信息过滤方法及系统
CN104462614A (zh) * 2015-01-14 2015-03-25 苏州大学 一种基于网络数据的主动学习方法及装置
CN105825224A (zh) * 2016-03-10 2016-08-03 浙江生辉照明有限公司 分类器族的获取方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2764472A4 (en) * 2011-10-03 2015-10-14 Aol Inc SYSTEMS AND METHOD FOR CARRYING OUT A CONTEXT CLASSIFICATION WITH MONITORED AND UNWARNED TRAINING
CN103218608B (zh) * 2013-04-19 2017-05-10 中国科学院自动化研究所 一种网络暴力视频的识别方法
CN104199845B (zh) * 2014-08-08 2018-05-29 杭州电子科技大学 基于主体模型的网上评论情感分类方法
CN105868686A (zh) * 2015-12-31 2016-08-17 乐视网信息技术(北京)股份有限公司 视频分类方法及装置
CN107451148A (zh) * 2016-05-31 2017-12-08 北京金山安全软件有限公司 一种视频分类方法、装置及电子设备
US20180121830A1 (en) * 2016-11-02 2018-05-03 Facebook, Inc. Systems and methods for classification of comments for pages in social networking systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324939A (zh) * 2013-03-15 2013-09-25 江南大学 基于最小二乘支持向量机技术的偏向性分类及参数寻优方法
CN103996130A (zh) * 2014-04-29 2014-08-20 北京京东尚科信息技术有限公司 一种商品评价信息过滤方法及系统
CN104462614A (zh) * 2015-01-14 2015-03-25 苏州大学 一种基于网络数据的主动学习方法及装置
CN105825224A (zh) * 2016-03-10 2016-08-03 浙江生辉照明有限公司 分类器族的获取方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"数据挖掘方法在评论分类中的应用研究";李杰骏;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170115;I138-843 *

Also Published As

Publication number Publication date
CN109145151A (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
US10509540B2 (en) Method and device for displaying a message
US20180121040A1 (en) Method and device for managing notification messages
CN105845124B (zh) 音频处理方法及装置
RU2640632C2 (ru) Способ и устройство для доставки информации
CN108038102B (zh) 表情图像的推荐方法、装置、终端及存储介质
CN104731688B (zh) 提示阅读进度的方法及装置
CN108227950B (zh) 一种输入方法和装置
CN106919629B (zh) 在群聊中实现信息筛选的方法及装置
WO2017020482A1 (zh) 票务信息展示方法及装置
CN104636164B (zh) 启动页面生成方法及装置
EP3089436A1 (en) Methods and devices for calling based on cloud card
CN106777016B (zh) 基于即时通信进行信息推荐的方法及装置
CN105447109A (zh) 关键字词搜索方法及装置
CN110781323A (zh) 多媒体资源的标签确定方法、装置、电子设备及存储介质
CN111046927B (zh) 标注数据的处理方法、装置、电子设备及存储介质
CN108984628B (zh) 内容描述生成模型的损失值获取方法及装置
CN106331328B (zh) 信息提示的方法及装置
CN110764627B (zh) 一种输入方法、装置和电子设备
CN112948704A (zh) 用于信息推荐的模型训练方法、装置、电子设备以及介质
CN111739535A (zh) 一种语音识别方法、装置和电子设备
WO2016197549A1 (zh) 一种进行搜索的方法和装置
CN105260088B (zh) 信息分类展示处理的方法及装置
CN109145151B (zh) 一种视频的情感分类获取方法及装置
CN111831132A (zh) 一种信息推荐方法、装置和电子设备
CN112784151A (zh) 一种确定推荐信息的方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant